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Résumé 

Nous étudions les régularités spatio-temporelles présentes dans les résultats électoraux et 
les taux de participation des communes (ou des bureaux de vote) des élections françaises 
entre 1992 et 2007. Nous essayons ensuite d'élaborer des modèles, basés sur une imitation 
simple des agents d'un même voisinage, en adéquation avec les données. 
Un complément développe une modélisation d'une expérience liée à la modification des 
choix d'un agent engendrée par la connaissance des choix des autres agents. 

Mots-clés : Données électorales • Régularités spatio-temporelles • Influence sociale • Ran- 
dom Field Ising Model 



Elections, a physical study 
Regularities, prédictions and models about French élections 



Abstract 

We study spatiotemporal regularities of électoral results and turnout rates for each mu- 
nicipality (or polling station) concerning French élections between 1992 and 2007. We try 
to account for the data using models based on a simple imitation of agents in the vicinity. 
We also propose a model of an experiment that shows how choices are modified by kno- 
wing the choices of others agents. 

Keywords : Electoral Data • Spatiotemporal Regularities • Social Influence • Random 
Field Ising Model 
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Voyant que la cité était souvent divisée et que par indifférence certains 
citoyens s 'en remettaient au hasard des événements, Solon porta contre 
eux une loi particulière : « Celui qui dans une guerre civile ne prendra 
pas les armes avec un des partis sera frappé d'atimie et n'aura aucun 
droit politique. » 

Constitution d'Athènes, Aristote [3J. 



Douter de tout ou tout croire, ce sont deux solutions également com- 
modes, qui l'une et l'autre nous dispensent de réfléchir. 
La science et l'hypothèse, Henri Poincaré [57] . 
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Avertissement 



Le corps principal de la thèse présenté ci-dessous, correspond au travail effectué depuis 
mars 2007 (date de la réception des premières données électorales). Seule cette partie a été 
véritablement développée car elle correspond, me semble-t-il, à la partie la plus innovante, 
ou tout simplement, la plus conséquente. Les autres travaux figurent néanmoins dans cette 
thèse, mais après la rédaction portant sur les données électorales. 

On y trouvera une modélisation —réalisée avec Jean-Philippe Bouchaud— d'une expérience 
qui mesure le changement des choix, généré par la connaissance du choix des autres 
agents [11] . Un développement supplémentaire accompagnera l'article mis ci-dessous. 
Deux autres articles, s'y trouveront aussi. Le premier —écrit avec Serge Galam— poursuit 
le travail du mémoire de Master intitulé Une distraction mathématique sur l'évolution 
d'opinion et se préoccupe des conséquences théoriques des contrariants lors d'une cam- 
pagne électorale [TU] . Le second —développé principalement par Matteo Marsili et Sal- 
vatore Miccichè— aborde l'éconophysique et le temps minimal pour l'émergence d'une 
structure dans les systèmes financiers [12] . 
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1 Introduction 

Ils font partie de la race des petits qui rendent toute chose petite. 
D'après Ainsi parlait Zarathoustra de Friedrich Nietzsche |52j . 




Que peut dire la physique sur les élections ? 

Voilà la question centrale qui animera toute cette thèse. Une question tellement vaste, 
qu'elle nécessite quelques précisions. 

Les élections se réduisent, ici, aux seules données électorales : résultats électoraux et 
taux de participation, par commune, voire par bureau de vote. Les données électorales 
sont considérées comme des mesures physiques, irréversibles et nettes, du choix de chaque 
électeur qui s'exprime lors d'un vote, ou de chaque électeur inscrit sur les listes électorales 
qui participe ou s'abstient à l'élection. Bref, les données électorales seront manipulées 
comme toute autre grandeur ou mesure physique, sans leur assigner une quelconque par- 
ticularité — i.e. sans se préoccuper de savoir pour qui ou pour quoi les électeurs sont 
appelés aux urnes, et en considérant donc toutes les élections de la même façon, sans faire 
aucune distinction. 

Les réponses que nous apporterons, l'angle d'attaque que nous suivrons, la grille d'in- 
vestigation que nous adopterons, ne prétendent nullement à l'exhaustivité. (Comment 
pourrait-il en être autrement en sciences ?) 

Enfin, les sciences sociales ne contribuent que très —trop?— peu dans ce travail, ce 
qui constitue peut-être l'une des plus grandes lacunes de cette étude. Pour se discul- 
per quelque peu, je dirai que cette thèse est une thèse de physique. J'évoquerai ensuite le 
temps limité d'une thèse (deux années et demie pour cette partie consacrée aux élections), 
ma trop faible connaissance des sciences sociales au commencement de la thèse, le fait de 
n'avoir pas trouvé (mais peut-être ai-je mal cherché?) des travaux dans ce domaine qui 
conviennent à l'objectif de cette thèse. 

Précisons donc l'objectif de cette thèse. 

Nous ne prétendons nullement comprendre, et encore moins expliquer, le comporte- 
ment de l'électeur en rapport à ses caractéristiques historiques ou socio-culturelles, ou bien 
en rapport aux divers événements économiques, sociaux ou politiques survenus lors de, 
ou avant, la campagne électorale. Nous cherchons à comprendre les données électorales, 
comme le ferait un physicien face à une somme de mesures fiables, d'un champ encore en 
friche. 

Cette compréhension se décompose en deux étapes. Tout d'abord, une recherche em- 
pirique des régularités présentes dans les données électorales. Ensuite, une investigation 
d'ordre théorique : retrouver les principaux phénomènes empiriques à partir d'un modèle 
reposant à la fois sur un faible nombre d'ingrédients, et sur une description microscopique 
plausible. 

Et tout ceci, en se tenant uniquement, et volontairement, aux données électorales par 
commune (ou par bureau de vote), et à leur localisation spatiale (la position géographique 
de la mairie de chaque commune]]. C'est l'un des partis pris de cette étude, et constitue 
en quelque sorte un défi à relever. 



1 L'idée d'étudier les résultats électoraux par commune et par bureau de vote revient entièrement à 
Jean-Philippe Bouchaud, ainsi que l'idée forte de cette étude : la prise en compte de leur localisation 
spatiale. 
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Les deux points ci-dessus, l'aspect empirique et l'aspect théorique de cette thèse, 
nécessitent encore des éclaircissements. 

Nous nous efforcerons de trouver des régularités dans les données électorales, et des 
régularités seulement. Nous bannirons, notamment, le contexte dans lequel se situe l'élection, 
les particularités et caractéristiques des candidats, des partis politiques, des choix proposés 
aux votes des électeurs, le comportement d'un même électeur face à diverses élections, etc. 
Bref, afin de parvenir aux régularités, nous nous intéresserons aux questions dites simples, 
au détriment des questions dites intéressantes — i.e. les questions qui attirent généralement 
l'attention du citoyen. 

Comme de coutume en physique, en éliminant les « détails », nous espérons atteindre 
des traits saillants des phénomènes ; traits sur lesquels pourront s'appuyer ensuite d'autres 
investigations, tant théoriques qu'empiriques. Nous n'affirmons pas que ces « détails » sont 
inintéressants, ou ne méritent aucune attention scientifique, nous disons seulement que 
nous ne voulons pas en tenir compte ici. Nous prenons délibérément le pari que les seules 
données électorales, conjuguées à leur localisation géographique, permettront d'obtenir 
des régularités, voire des traits pertinents, du phénomène électoral. 

Prenons un exemple. Avant d'étudier convenablement la chute des corps, et en parti- 
culier la chute des feuilles —aussi belles et poétiques soient-elles—, il semble préférable de 
commencer l'étude par la chute des graves dans le vide. Non pas que les « détails » (ici 
la forme et la rigidité de la feuille, la présence de l'air, etc.) n'aient aucune importance, 
mais, sans que l'on puisse s'en abstraire, le début d'une construction scientifique de la 
chute des corps paraîtrait bien hasardeuse et bien difficile. 

Faisons une digression. Nous constatons a posteriori que l'une des plus grandes erreurs 
des premiers penseurs grecs présocratiques, notamment les milésiens Thalès, Anaximandre 
et Anaximène [58] —appelés par la suite, à tort au sens étymologique, philosophes— fut 
de s'intéresser à des questions dites intéressantes (comme le principe originel, archê, ou 
l'éclair, le tonnerre, les ouragans, la grêle, l'arc-en-ciel, les tremblements de terre, etc.), 
plutôt qu'à des questions dites —a posteriori encore— simples. (Ce qui n'enlève en rien 
à l'immense mérite qui leur est dû, ainsi qu'à celui de leur civilisation. La critique a 
posteriori, une fois « hissé sur les épaules des géants », étant toujours facile.) Encore 
faudrait-il, au temps présent, savoir quels problèmes simples se poser, et ce sans faire 
intervenir de particularités historiques, spatiales, téléologiques, d'essence, de nature, etc. 
Sous cette optique partielle, le génie de Galilée [29, 30J fut d'arriver à trouver ces « bons » 
problèmes, outrepassant par la même les détails inhérents à une vision commune, et d'y 
avoir répondu. A l'écheveau par la suite de pouvoir être dénoué. Ou déjoué. 

Signalons dans cette jeune branche —à l'avenir, espérons-le, bien prometteur— de la 
physique, nommée physique sociale [59] ou sociophysique, l'existence de très belles études, 
étayées par une multiplicité de sources différentes, sur la recherche des régularités empi- 
riques dans les phénomènes sociaux (notamment, [61, 62J). 

Nous nous efforcerons ensuite de trouver des modèles qui, bien évidemment, s'ac- 
cordent du mieux possible aux données, ou plus précisément aux principaux traits tirés 
de l'analyse empirique précédente. De plus, les modèles utilisés doivent traduire une dy- 
namique plausible, à l'échelle microscopique (à l'échelle des agents, ici), et au regard de la 
grandeur mesurée (les choix des agents d'une commune). Précisons que nous cherchons à 
élaborer des modèles, et non une théorie. Nous en sommes encore à un stade, semble-t-il, 
bien prématuré pour pouvoir l'envisager. En revanche chaque modèle développe, sous une 
forme qui lui est propre, une même thématique commune, une même question centrale 
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posée aux données. 

Sous l'angle épistémologique, nous comprenons ici les modèles comme des questions 
posées aux données. Les modèles que nous utiliserons reposent en effet sur peu d'ingrédients, 
et leurs traits saillants s'identifient aisément. La signification probable, tirée d'un accord 
ou non du modèle aux données, s'en trouve dès lors facilitée. 

Enfin, signalons que nous adopterons sciemment l'hypothèse zéro des phénomènes so- 
ciaux traités par la physique, et notamment par la physique statistique : l'individu comme 
un spin qui opine, un atome social. 

Avant de commencer l'étude à proprement parler, faisons deux remarques préalables. 

Nous emploierons sans scrupule les mots d'influence sociale, d'imitation, d'interaction 
entre agents, et ce sans tenir compte d'une riche littérature (voir par exemple [HJ 123] ) 
qui les analyse, les distingue et les teste expérimentalement. 

La possibilité de manipuler et de se confronter aux données électorales (une mesure 
précise et irréversible du choix des électeurs) possède un avantage supplémentaire : esqui- 
ver au maximum toute référence à cet « objet » encore trop flou, ou trop inconsistant à 
nos yeux, nommé opiniorjl |Hl [T6] . 



2 Je remercie Stéphane Laurens et Birgitta Orfali pour avoir appuyé ce point lors d'une discussion 
orale. 
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2 Enquête : des généralités aux prédictions 



Le risque le plus certain est de ne pas prendre de risque. 
D'après Arnaud Laroche [13] . 

La plupart des études de physique consacrées aux résultats électoraux concernent les 
élections à choix multiple, où l'on cherche essentiellement à établir, puis à justifier, les 
distributions statistiques en loi de puissance ou en log-normale de la répartition des votes 
sur les nombreux candidats ; comme au Brésil [T9l Eûl US, E] , au Brésil et en Inde [33] , en 
Inde et au Canada [77] , au Mexique [U HE] , en Indonésie [78] , et enfin avec une recherche 
de loi universelle [25]. Araripe et al. pQ étudient les statistiques des élections des maires, 
en se focalisant sur les cas à petit nombre de candidats. Sadovsky et Gliskov [HE] se 
préoccupent d'une typologie des élections russes. Schneider et al. [71] mettent en évidence 
une corrélation entre les résultats électoraux et le nombre d'adhérents des partis politiques. 
Hernândez-Saldana [37] étudie la distribution des votes de trois élections mexicaines par 
cabine de vote et l'espacement de leur résultat. Berger et al. [7J montrent comment la 
présence d'écoles, d'églises, etc., influence le vote, notamment aux élections générales 
d'Arizona (USA). 

Pour une approche théorique de l'évolution d'opinion, on pourra consulter [THl Eûl El 
172] avec leurs nombreuses références. 

2.1 Les résultats des élections nationales binaires 

2.1.1 Vue d'ensemble 

Pour des raisons de simplicité nous étudions les élections portant, d'une part, sur un 
choix binaire, et d'autre part, sur le même choix à l'échelle nationale, française en l'occur- 
rence. Nous restreignons de plus cette étude à la France métropolitaine. Un choix binaire 
semble en effet plus facile à analyser —pour une première étude— qu'un choix multiple. 
Nous justifierons par la suite pourquoi étudier des élections nationales qui portent sur 
le même choix, et pourquoi se limiter aux données de la France métropolitaine. Nous ne 
faisons plus ensuite de discrimination, i.e. nous analyserons sans aucune distinction toute 
élection répondant aux critères ci-dessus, dès lors que nous possédons leurs données sur 
l'ensemble des communes, voire sur l'ensemble des bureaux de vote. La table [T] indique les 
élections traitées : les seconds tours d'une présidentielle et les référendums —dans lesquels, 
l'électeur qui s'exprime, dépose dans l'urne un bulletin de vote au nom de l'une des deux 
alternatives proposées sur l'ensemble du pays. 



Année 


type d'élection 


choix binaire 


exprim 


moy 


1992 


référendum, traité de Maastricht 


oui-non 


25,2 10 6 


0,508 


1995 


présidentielle, second tour 


Chirac- Jospin 


29,0 10 6 


0,525 


2000 


référendum, quinquennat présidentiel 


oui-non 


9,84 10 6 


0,729 


2002 


présidentielle, second tour 


Chirac-Le Pen 


30,1 10 6 


0,820 


2005 


référendum, traité constitutionnel européen 


oui-non 


27,5 10 6 


0,550 


2007 


présidentielle, second tour 


Royal-Sarkozy 


34,2 10 6 


0,533 



TAB. 1 — Élections nationales portant sur un même choix binaire à l'échelle nationale, et ana- 
lysées pour leurs résultats. Le choix en gras désigne le gagnant du scrutin avec sa moyenne (moy) 
sur le nombre de votes exprimés (exprim) pour la France métropolitaine. 
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Les données électorales proviennent!! du bureau des élections et des études politiques 
du ministère de l'intérieur. Pour chacune des élections, il figure au minimum, le nom de la 
commune (et éventuellement le numéro du bureau de vote), les nombres de personnes ins- 
crites sur la liste électorale, de votants, de bulletins blancs ou nuls, de suffrages exprimés, 
et enfin, le nombre de voix pour chacun des choix proposés aux électeurs. 

Considérons une élection donnée. N expr désigne le nombre de bulletins exprimés, et 
Ngagm le nombre de voix du résultat gagnant, tous deux à l'échelle nationale. Le choix 
gagnant au niveau national sert ensuite de référence aux résultats de toutes les communes 
(ou de tous les bureaux de vote) de la France. Ensuite, N" xpr et Ng agn , désignent respec- 
tivement pour la commune (ou le bureau de vote) a, le nombre de bulletins exprimés et 
le nombre de votes en faveur du choix nationalement gagnant (même si J° gn < 50%). 

* expr 

Afin de pouvoir comparer plus aisément les résultats électoraux des différentes élections, 
notamment en diminuant l'influence de leur résultat moyen, il convient de changer de va- 
riable, i.e. de passer du résultat en pourcentage usuellement donné 

P=§^, (1) 

^ expr 

borné entre et 1, à une variable non bornée et symétrique, comme par exemple 



ln 



■Ngagn \ \ ( P 



1 ' expr 1 ' gagn 1 r 

De manière générale, r = ln où N + et iV_ dénotent les nombres de personnes qui 

ont réalisé chacun des deux choix binaires « + » et « - », sur un total de N = iV_ + N + 
personnes. Avec cette notation générale, p s'écrirait comme p — Noter que ln {jf-) = 
— r, ce qui procure l'aspect symétrique de r. Bref, un résultat p de 50% équivaut à r = 0, 
ceux supérieurs à 50% donnent r > et inversement. Afin d'éviter un r infini nous 
transformons dans les deux cas extrêmes N gagn d'une demi-voix, soit plus précisément 

Ngagn -^earpr * ^gagn -Aercpr 0,5 et Ng a g n ► -Agagn 0,5. 

Les figures [T] représentent les histogrammes, centrés sur leur moyenne, de l'ensemble 
des résultats r a par commune (ou par bureau de vote). La table [2] fournit des statistiques 
élémentaires de la distribution des résultats par commune r a et, si possible, par bureau 
de vote. Les histogrammes et statistiques en grandeur p se trouvent en appendice (cf. 
Fig. IA-11 et Tab. IA-111 . Nous travaillerons par la suite préfèrent iellement avec la gran- 



deur r, puisqu'elle laisse apparaître bien plus de régularités entre différentes élections des 
histogrammes et des statistiques, qu'avec la variable usuelle p. Remarquons néanmoins 
que l'on peut choisir d'autres grandeurs symétriques et non bornées obtenues à partir de 
p, comme par exemple —erfc^~ l \2p)^ ou toute autre fonction cumulative inverse d'une 
distribution de probabilité symétrique et définie sur M. 

2.1.2 La distribution binomiale d'un vote aléatoire, indépendant et identi- 
quement distribué 

Pour commencer, vérifions l'hypothèse la plus naïve possible, autrement dit vérifions 
si le vote représente un processus aléatoire indépendant et identiquement distribué sur 
l'ensemble du territoire. 



3 Mme Brigitte Hazart, du bureau des élections et des études politiques m'a aimablement fournies les 
données, suite parfois, à un véritable travail de sa part. Cette thèse lui doit beaucoup, et je la remercie 
grandement. Un remerciement à Frédéric Debever de la préfecture de l'Aube qui m'a envoyé par courrier 
les résultats du second tour des présidentielles de 1995, des communes de son département. 
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FlG. 1 - Histogrammes des résultats r des communes à gauche et des bureaux de vote à droite, 
ramenés à une moyenne nulle. La lettre b ajoutée à l'année précise une l'élection de type binaire. 
Ces légendes s'appliqueront aux élections équivalentes des figures qui suivront. 



Année 


com. 


moy 


éc-typ 


skew 


kurt 


bur. 


moy 


éc-typ 


skew 


kurt 


1992 


36186 


-0,164 


0,447 


-0,159 


2,48 












1995 


36197 


0,187 


0,524 


0,357 


2,71 












2000 


36202 


0,874 


0,498 


-0,116 


2,77 


62253 


0,948 


0,454 


-0,289 


3,33 


2002 


36215 


1,48 


0,521 


0,776 


2,26 


62352 


1,54 


0,521 


0,476 


1,17 


2005 


36220 


0,377 


0,443 


-0,021 


1,37 


62775 


0,295 


0,530 


-0,224 


0,989 


2007 


36219 


0,257 


0,487 


0,174 


2,31 


63516 


0,185 


0,499 


0,185 


1,72 



TAB. 2 - Moyennes (moy), écarts- types (éc-typ), skewness (skew) et kurtosis (kurt) des résultats 
r sur l'ensemble des communes (com.), et si possible sur l'ensemble des bureaux de vote (bur.). 



Pour cela, les figures [2] tracent pour chaque élection les écarts-types des résultats des 
communes (ou des bureaux de vote) en fonction du nombre de suffrages exprimés N expr par 
commune (ou par bureau de vote), et les comparent au cas d'une distribution binomiale 
des votes. Les 36 intervalles, à l'intérieur desquels s'évaluent les écarts-types, contiennent 
sensiblement le même nombre de communes (~ 1000), ou de bureaux de vote (~ 1700). 
Autrement dit, les 36 boîtes qui regroupent les communes (ou les bureaux de vote) n'ont 
pas la même largeur, mais contiennent toutes le même nombre environ de communes (ou 
de bureaux de vote). 

L'écart-type d'une variable indépendante et identiquement distribuée, réalisée dans des 
ensembles de taille N, décroît —avec des conditions peu restrictives— en d'après la loi 
normale. Et dans le cas qui nous concerne, le processus binomial décrit plus spécifiquement 
un vote aléatoire et indépendant. En effet, un processus de vote aléatoire et indépendant 
à l'intérieur d'une commune (ou d'un bureau de vote), de nombre de bulletins exprimés 
N exp r, correspond à N expr tirages aléatoires indépendants, de probabilité de réussite p en 
faveur du choix gagnant à l'échelle nationale, et (1 — p) en faveur de l'autre choix. Il 
faut ensuite imposer la même valeur p à l'ensemble des communes (ou des bureaux de 
vote) pour que ce processus devienne identiquement distribué. Dans ce cas, p provient du 
résultat moyen de l'élection à l'échelle nationale (cf. Tabs. [Tl ou IATT1) . En résumé, selon 
l'hypothèse d'un vote aléatoire, indépendant et identiquement distribué sur l'ensemble du 
territoire national, le résultat p a d'une commune (ou d'un bureau de vote) de bulletins 
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FlG. 2 — Écart-type des résultats r en fonction du nombre de suffrages exprimés N expr , calculé 
avec 36 intervalles ; pour les communes à gauche et pour les bureaux de votes à droite. Le 
« modèle zéro » (voir Eq. (jl|)) et les tirages binomiaux indépendants (voir Eq. ([3|)) s'effectuent 
à partir des valeurs réelles de l'élection 2007-b. La valeur moyenne N expr de l'échantillon des 
communes de plus grande taille doit se considérer avec précaution puisqu'interviennent des 
valeurs extrêmes. La notation Ar .1 signifie l'écart-type d'une variable au sein d'un échantillon 
e (répertorié sur l'axe des abscisses), et s'appliquera aux figures similaires. 



exprimés N" xpr , dérive d'une loi binomiale de probabilité p sur Nf essais, soit : 

p a = Binomial(p ; N^ xpr ) . (3) 



Notons A[_] I , l'écart-type d'une grandeur pour des communes (ou des bureaux de 

N expr 

vote) de même N expr . Il vient alors pour des tirages binomiaux provenant de l'équation (J3]) : 



A[p,binomiai] I = \l iSr^T- Ce qui s'écrit en variable r : A[ TjWnomioI ] | 



y/p(l-p)N ex 



) 

pr 



avec de nouveau la décroissance en 1/ a/ N expr de la loi normale. 

Puisque le résultat moyen d'une élection varie en fonction de la taille des communes 
ou des bureaux de vote (voir les figures IA-21 en annexe) , la probabilité p de la formule 
précédente devient p N , la moyenne des p de l'échantillon où se situe N expr . La Fig. [2]reporte 
cette expression pour l'élection 2007-b où N expr correspond à la moyenne des suffrages 
exprimés de l'échantillon. (Les figures IA-31 en annexe représentent les histogrammes du 
nombre de suffrages exprimés et du nombre d'électeurs inscrits par commune et par bureau 
de vote.) 

Assez pinaillé avec ces variations de moyenne. Les figures [2] réfutent sans équivoque 
l'hypothèse naïve testée. Une élection diffère donc d'un processus aléatoire où chaque 
électeur dépose indépendamment un bulletin de vote, avec la même probabilité à l'échelle 
nationale. 



2.1.3 « Modèle zéro » 

A ce stade, les figures [5] peuvent suggérer un rapprochement avec un type de modèle 
simpliste, noté ici « modèle zéro ». Ces figures laissent en effet apparaître une même 
tendance générale pour les 6 élections analysées : un écart-type A[ T ]| décroissant en 

N expr 

1/ v/ N expr pour les faibles N expr , et stable pour les grands N expr . Le « modèle zéro » 
complexifie un peu plus l'hypothèse naïve d'un tirage binomial uniforme —précédemment 
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testée et invalidée— en ajoutant à la probabilité p, sur laquelle opère le tirage binomial, 
un bruit supplémentaire, t], par commune. 

Plus précisément, selon le « modèle zéro », la probabilité sur laquelle repose les 
tirages binomiaux —aléatoires et indépendants— fluctue d'une commune à l'autre, et vaut 
(Pn + r f x ) pour une commune a ayant N^ xpr bulletins exprimés, rf dénote la réalisation 
sur la commune a d'une variable aléatoire, rj, indépendante, et donc non corrélée entre 
différentes communes. p N désigne, comme précédemment, la moyenne des p de l'échantillon 
en N expr auquel appartient N^ xpr . Le résultat p a d'une commune a s'écrit alors comme 

p a = Binomial(p N + r] a ; N* xpr ) , (4) 

où r] a , indépendant d'une commune à l'autre, provient d'une distribution de moyenne 
nulle, d'écart-type a v , et de nature gaussienne pour des raisons de généralité et de sim- 
plicité. L'amplitude des fluctuations, a v , provient alors de l'échantillon e en N expr qui 
minimise l'écart-type en grandeur p des résultats, i.e. a v = (Aj^J min . Cet échantillon se 
trouve parmi les échantillons de grands N expr , i.e. avec un bruit binomial faible. 

Attardons-nous sur l'amplitude ou écart-type a v des fluctuations rj. Les figures [2] 
montrent pour des échantillons e de grands N expr , un écart-type des r a qui tend vers 
une constante valant approximativement Ar r i ~ 0,4 pour les 6 élections traitées, ex- 
ceptée celle de 2000. Or, si r = f + £, avec r = ln(^=), il vient au premier ordre en £ de 
l'équation Q : p — p+p(l — p) £. Il en découle que A[ p ] e ~ p(l — p)A[ T ] e , et toujours pour 
des échantillons, e, de grands N expr . Or, dans les échantillons à forts N expr , les fluctua- 
tions de 7] prédominent sur celles occasionnées par un bruit binomial, i.e. Ar p i ~ o^. En 
d'autres termes, le bruit binomial proportionnel kl/ a/ N expr devient, dans les échantillons 
à grands N expr , négligeable devant les fluctuations de rj. Fait notable? donc, l'intensité 
des fluctuations de rj s'écrit comme, a v ~ p . (1 — p) . A, avec A = (A[ r j e ) min ~ 0, 4 pour 5 
des 6 élections traitées. 



Voyons maintenant par des arguments heuristiques, 
pourquoi l'écart-type des r dans des échantillons à forte 
population (A[ T ]J ne dépend pas du résultat moyen (r ou 
p, cf. Tabs. [2] et IA-11) de l'élection considérée. (On écarte 
dans ce paragraphe le cas de l'élection de 2000 qui semble 
représenter une exception.) 

Plaçons-nous pour cela dans dans les communes à 
grand N expr , i.e. dans des communes que le bruit binomial affecte peu, et que nous 
négligerons ici. Prenons une image assez classique en physique qui consiste à interpréter 
l'existence d'un équilibre, ici la moyenne p de la commune, par l'action mécanique des 
ressorts. Considérons alors un équilibre, p, résultant de la tension entre deux ressorts co- 
axiaux différents : le premier, de constante de raideur K + tend à déplacer p vers 1 ; le 
second, de constante de raideur K_, tend au contraire à attirer p vers 0. A l'équilibre 
K+(l - p) = K^p, d'où r = In(ï^) = ln(f±). 

Considérons maintenant un ensemble de couples de ressorts (K + , K_) caractérisés 
par une moyenne respective K + et K_ avec, chose importante, des fluctuations relatives 
d'intensité indépendante des valeurs moyennes. Une commune donnée aura alors K + = 
K + + 5 K + telle que = e + , et de façon similaire, _KT_ = + 6 K_ avec = e_. 

Ici, (e + ) = (e_) = et ((e + ) 2 ) = ((e:_) 2 ) = (cr e ) 2 . Avec un développement limité au 
premier ordre en e, r ~ ln(=) + (e + — En conclusion, r fluctue, comme nous le 
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cherchions, autour de sa moyenne, r ~ ln(=) avec une variance (2(cr e ) 2 ) indépendante 
de la moyenne r. 

Nous avons développé ces petits calculs pour un résultat somme toute assez classique 
—dès lors que l'intensité relative des fluctuations ne dépend pas de la valeur moyenne et 
qu'interviennent des grandeurs logarithmiques— afin de mieux comprendre les fluctuations 
de r dans les zones à forte population, approximativement identiques pour 5 des 6 élections 
analysées ici (voir Fig. [2]). 

Notons pour terminer que cette vision simpliste, correspondante au dénommé « modèle 
zéro », a aussi le mérite de retrouver des statistiques assez comparables à celles des 
résultats réels. Mais nous y reviendrons ultérieurement. 

2.1.4 Prise en compte des coordonnées spatiales des communes 

Bref, devrions-nous en rester là et se contenter d'une variante du « modèle zéro » ? 
Non, bien évidemment ! Mais quel questionnement pourrait enrichir cette étude ? Sur 
quelle méthode d'investigation se baser ? 

Parmi l'ensemble des grilles d'analyses qu'arbore la physique, nous adopterons l'une 
des plus classiques en physique statistique : l'influence due au voisinage. 

Nous disposons via le Répertoire Géographique des Communes [39J de l'IGN (l'Ins- 
titut Géographique National) des coordonnées spatiales XY (longitude et latitude selon 
l'ellipsoïde de Lambert 2 étendu^) de la mairie de chaque commune à une précision de 
100 m près. Cette base de données, établie pour l'année 1999, servira pour toutes les 
élections traitées. Autrement dit, dans le cas des fusions ou des scissions des communes 
par rapport à cette date —ce qui ne dépasse pas la vingtaine de cas sur plus de 36200 
communes métropolitaines— nous nous ramènerons à leur recensement de 1999. (Les Fi- 
gures IA-41 indiquent les coordonnées XY des communes ou des bureaux de vote, avec de 
plus, un classement selon leur population.) 

Le Répertoire Géographique des Communes [39] fournit aussi pour chaque commune, 
l'altitude, la superficie et une estimation de la population. 

Justifions les restrictions que nous avions volontairement imposées, en début de ce 
chapitre (cf. section 12.1. ip . à cette étude portant sur les données électorales. Une prise 
en compte aisée des effets dus à la localisation spatiale des résultats électoraux nécessite 
de considérer des élections portant sur un même choix à l'échelle nationale. Pour s'en 
convaincre, il suffit d'envisager la difficulté d'appréhender les effets spatiaux des résultats 
électoraux sur des élections communales —qui portent sur un ensemble de choix, propre à 
chaque commune. D'autre part, l'analyse des données électorales cantonnées à la France 
métropolitaine permet d'amoindrir les effets de bord d'une étude à caractère spatial. Les 
effets de bords deviennent en effet d'autant plus prépondérants que les surfaces considérées 
deviennent petites. 

2.1.5 Corrélations spatiales 

Calculons les corrélations spatiales des résultats, r, d'une même élection en fonction 
de la distance séparant les communes. 

Mais auparavant introduisons un détail permettant d'amoindrir l'effet de l'hétérogénéité 
de la répartition spatiale des communes. Notons r a p la distance séparant les communes 

4 Un remerciement à Alain Borg de l'IGN pour m'avoir fourni les informations nécessaires à l'exploi- 
tation du fichier téléchargeable [31] . 
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FlG. 3 - Corrélation spatiale des résultats r, des communes à gauche et des bureaux de vote 
à droite, où R a p = ^jf £]2n;2(n + 1)]. La distance départementale caractéristique D (environ 
2, 7 km) pour les communes s'applique également à celle des bureaux de vote. 



a et 8, puis D = «/ ^ — la distance caractéristique du département (où se situe la com- 

y * ^com 

mune a) de superficie S et de nombre de communes n com . (D ~ 2,7 km en moyenne sur 
l'ensemble des départements.) La grandeur sans dimension, R a p = , évalue alors la 
distance séparant la commune 8 de a, en tenant compte de la densité des communes du 
département de a. 

La corrélation spatiale C(R) peut s'écrire comme 

où le calcul s'effectue sur les N a p paires de communes appartenant à des couronnes 
R af3 e]2n;2(n + 1)]. Les moyennes comme (r a ) = j^Y,^^ et ( r/3 ) = jv^E«,/3' r ' 3 
s'obtiennent à partir des communes a et 8 ainsi considérées. (Ces deux moyennes se dis- 
tinguent l'une de l'autre à cause de la dissymétrie engendrée par les différentes distances 
caractéristiques départementales.) Enfin signalons que la corrélation spatiale peut se cal- 
culer différemment comme par exemple dans [82J. 

Les figures [3] montrent pour les corrélations C (R) entre communes : 

- une corrélation spatiale très étendue à l'échelle de la France (supérieure à environ 
80 R, i.e. à des distances supérieures à 200 km environ) ; 

- une décroissance quasi-logarithmique en distance ; 

- une corrélation relativement importante (environ 0, 5) entre proches communes, pour 
toutes les élections hormis celle de 2000. 

Ces courbes permettront par la suite de retenir, voire de calibrer, différents modèles. 

Mais dans l'immédiat, l'étude des corrélations spatiales des résultats infirme le « modèle 
zéro » pour lequel C(R) < 0, 06 ici ; bien loin donc des valeurs obtenues pour les résultats 
réels. (Peut-être aurions-nous pu écrire un bel article avec de belles figures à l'appui et 
force commentaires sociologiques si nous n'avions pu adjoindre aux données électorales 
leur information spatiale ?) 



16 



2.1.6 Effets de l'environnement 



Puisque l'étude des corrélations spatiales C(R) des résultats par commune a montré 
une forte dépendance du résultat d'une commune par rapport à ses communes voisines 
(voir Fig. [3]), scrutons plus finement cette influence locale. Voyons donc les relations 
existantes entre les résultats d'une commune et les résultats des communes de son envi- 
ronnement. 

Définissons l'environnement V" 6 d'une commune centrale a, par ses n p = 16 plus 
proches communes. Bien qu'arbitraire, le nombre n p = 16 concilie à la fois, la proxi- 
mité des communes faisant partie de l'environnement de la commune centrale, à des 
fluctuation —dues aux tailles des échantillons— pas trop importantes. Tous les autres 
choix n p = 4, 8, 32, 64 et 128 que nous avons testés, vérifient les conclusions tirées de 
n p = 16. Autrement dit, la convention arbitraire, n p = 16, du nombre des communes 
les plus voisines d'une commune centrale a, et considérées comme l'environnement de a, 
a un caractère robuste. Sauf mention contraire, toutes les tables et figures qui suivront 
faisant intervenir l'environnement autour d'une commune centrale, auront celui-ci défini 
par ses n p = 16 plus proches communes. Remarque : à l'échelle des bureaux de vote, 
l'environnement V" 6 d'une commune centrale a comprend l'ensemble des bureaux de vote 
que contient les n p = 16 plus proches communes de la commune centrale a. 

L'environnement V" 6 d'une commune centrale a peut se caractériser relativement cor- 
rectement à l'aide des deux premiers moments de sa distribution des résultats r. 

- la moyenne de ses résultats électoraux : 



p /3evf 6 

- la déviation standard de ses résultats électoraux : 



? = ^5> e ; («> 



\ 



/3ev 
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où j3 désigne l'une des n p communes les plus proches de la commune centrale a. Quand Tq 
et (Tq s'évalueront non pas à partir des données par commune, mais à partir des données 
par bureau de vote, il suffira de remplacer n p dans les deux équations ci-dessus, par le 
nombre de bureaux de vote à l'intérieur de Vf 6 . 

Noter que nous optons pour la moyenne définie ci-dessus plutôt que par ln( ^ ^ 6 ^J — 



E/3eV^ g Nexpr N gag , 



afin d'éluder la variation des résultats des communes en fonction de leur taille (voir 
Fig. IA-2| ). De même, nous préférons définir l'environnement d'une commune centrale par 



un nombre, n p , fixe de ses plus proches communes, plutôt que par un nombre variable de 
communes dont la proximité à la commune centrale n'excède pas une distance limite fixe, 
et ce afin d'écrire proprement la dispersion standard o"q . Ainsi, ctq ne fluctue pas plus 
ou moins fortement selon le nombre plus ou moins grand de communes voisines prises en 
compte. Enfin, tout au long de cette étude nous amalgamons la valeur de l'écart-type, à 
son estimation statistique [67J. 

Les figures |A~31 en annexe tracent les corrélations spatiales des t$ et des (Tq, calculés à 
partir des résultats électoraux par commune pour chaque élection. Ces courbes peuvent se 
comparer aux corrélations spatiales des t$ et (Jq issus d'un mélange aléatoire des résultats 
des communes, ainsi que ceux calculés à partir du « modèle zéro ». De plus, les figures lÂ^BI 
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reportent, en fonction de leur classement, les positions géographiques des (7q de l'élection 
2007-b, issus des résultats par commune et par bureau de vote. 

L'effet du voisinage sur le résultat de la commune centrale peut s'analyser en traçant la 
moyenne et l'écart-type des r a en fonction de Tq et de <Tq . Nous calculons donc la moyenne 
et l'écart-type des résultats r a de toutes les communes centrales ayant les mêmes valeurs 
de Tq (ou de <Tq), ou plus précisément à l'intérieur des échantillons définis en Tq (ou en 
<Tq). Les valeurs Tq et <Tq caractérisant l'environnement se répartissent dans cette étude 
en 36 intervalles, contenant chacun environ 1000 communes centrales. 

Afin d'étudier de concert toutes ces élections nous normalisons les valeurs caractérisant 
l'environnement V" 6 , soit <7q — > et Tq —* T °^ T ^ (où (...) et A[...j désignent respec- 
tivement la moyenne et la déviation standard de la grandeur considérée sur toutes les 
communes de la France métropolitaine). L'écart-type des résultats r par échantillon e, 
A[ T ]| (noté A[ r ] e aux figures HJ), se normalise en le divisant par l'écart-type à l'échelle 

nationale (i.e. A[ r ]| e — » A ^ - ) , et quant à la moyenne des résultats r dans un échantillon 

e : (t)\ — > ^ T a e ~^ ■ Nous utilisons volontairement le même facteur correctif x^— pour 

'U A[ T0 ] ^ A [ro ] 

l'abscisse et l'ordonnée afin de rendre explicite la droite y = x. 

Les courbes ainsi obtenues peuvent se voir aux figures Hl ainsi que la moyenne de 
l'écart absolu \r a — Tq\ en fonction de Tq et de ctq. Les figures en annexe, Fig. IA-71 et 
Fig. IA-81 représentent respectivement les histogrammes de Tq, de ctq et de (r Q — Tq) ainsi 
qu'une éventuelle connexion entre les deux grandeurs caractérisant l'environnement, soit 
<Tq = /(tq) et Tq = /(o"q). Afin de mieux distinguer les spécificités des résultats réels, 
et plus particulièrement des spécificités liées à leur localisation spatiale, nous adjoignons 
deux autres courbes à ces courbes réelles. La première provient d'un mélange aléatoire 
des résultats de l'élection de 2007, où chaque commune se voit attribuée le résultat d'une 
autre commune choisie aléatoirement. La seconde dérive du « modèle zéro », appliqué 
encore aux données de l'élection 2007. 

Remarquons la connexion entre corrélation d'une part, et, d'autre part, le type de 
courbes tracées ici. Considérons pour cela le cas simpliste de deux variables aléatoires A 
et Y telles que Y{ = aXi + b + rji, où r\ désigne un bruit blanc gaussien de moyenne nulle 
et indépendant de A. Le coefficient a peut se voir directement sur la courbe donnant 
la moyenne de Y en fonction de X, i.e. de la moyenne des Y en fonction de l'intervalle 
des X. Pour simplifier, supposons que l'écart-type, A[yJ , des Y calculé à l'intérieur d'un 
échantillon e en A, prenne la même valeur pour tous les échantillons, égale à une constante 
c multipliée par l'écart-type des Y sur l'ensemble des réalisations (i.e. A[y]| = c.Ajyj). 

La corrélation Cxy = ^"P~^P'^ entre A et Y sur l'ensemble des réalisations peut alors 

A [X]- A [Y] 1 

s'écrire comme Cxy — ±Vl — c 2 . Cette équation convient à un nombre d'intervalles suffi- 
samment grand (pour que A ~ este à l'intérieur d'un intervalle défini en A) mais pas trop 
grand (pour que l'écart-type des Y calculé dans un échantillon ait un sens). Le coefficient 
c, directement visible sur la courbe reportant l'écart-type de Y en fonction de A, indique 
donc un degré de corrélation entre A et Y. Plus c devient petit devant 1, plus le taux de 
corrélation entre A et y augmente. 

Interprétons les courbes de la figure Hl Les courbes de Fig. 0]-a permettent de savoir 
qu'en moyenne la commune centrale vote comme la moyenne des communes de son voi- 
sinage. Cette régularité s'applique à chaque élection, et ne dépend donc, ni du résultat 
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FlG. 4 — Effet de l'environnement sur le résultat de la commune centrale. En trait magenta 
continu, les résultats de l'élection 2007-b mélangés aléatoirement ; et en trait bordeaux continu, 
le « modèle zéro » appliqué au données de l'élection 2007-b. Cette légende vaudra pour les figures 
IA-71 et IA-81 en annexe. 

global de l'élection à l'échelle nationale, ni de la moyenne des résultats locaux, Tq. La 
figure 0]-b indique l'intensité de cette polarisation qui, en outre, ne dépend quasiment 
pas de la valeur de Tq, sauf à ses valeurs extrêmes. La figure HJ-c montre que l'écart ab- 
solu \r a — Tq\ en fonction de Tq des résultats réels s'apparente à celui issu d'un mélange 
aléatoire des résultats. Nous reviendrons ultérieurement sur la différence de comportement 
des courbes réelles de la figure Hl-d. Par contre, les courbes des figures H]-e et E]-f dévoilent 
une nouvelle forme de régularité qui fait intervenir <Tq . En effet l'écart en valeur absolue, 
\r a — Tq\, entre le résultat r a de la commune centrale a et la moyenne Tq des résultats 
des communes du voisinage de a, augmente avec <Tq de façon similaire pour chacune des 
6 élections (voir Fig. 0]-f). L'accroissement de |r Q — Tq\ avec la dispersion ctq implique 
ensuite, comme la figure 01-e le visualise, une augmentation de l'écart-type des r a avec Uq . 
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Bref, l'écart des résultats de la commune centrale à ceux de son voisinage augmente avec 
la dispersion locale des résultats, et de la même manière pour toutes les élections. 

Ces figures viennent, notamment, de mettre en évidence un phénomène quelque peu 
nouveau à nos yeux. L'influence de l'environnement sur une commune centrale ne se réduit 
pas à sa moyenne. L'hétérogénéité des résultats des communes comprises dans l'environ- 
nement importe aussi. La dispersion, des résultats r de l'environnement, se trouve de 
plus connectée au résultat de la commune centrale de la même manière pour chacune des 
élections analysées. 

Efforçons nous maintenant de comprendre l'augmentation de |r Q — Tq\ en fonction de 
o"o , Q u i se reproduit quasiment à l'identique pour les résultats des 6 élections analysées 
(voir Fig. 01-f). Cherchons l'origine de cette permanence de la façon la plus simple possible 
— i.e. nécessitant le moins d'interprétation ou d'information possible— avec des arguments 
d'ordre statistique. L'hypothèse la plus naïve attribuerait à l'écart entre r a et Tq, la va- 
leur de la dispersion <Tq des résultats du voisinage autour de la commune a, en moyenne 
évidemment. Dit autrement, la commune centrale a, plongée dans son environnement, 
n'introduit ni plus ni moins de dispersion des résultats que celle propre à son environne- 
ment, (Jq . Dit encore autrement, la même « agitation » des résultats (comme celle dérivant 
en physique d'un bain thermique local) prévaut aussi bien pour les communes de l'envi- 
ronnement que pour la commune centrale. 

Pour vérifier cette hypothèse, nous traçons directement et sans normalisation l'écart- 
type de {r a — Tq) en fonction de la dispersion <Tq des 6 élections, et les comparons à deux 
courbes issues des simulations reposant sur l'hypothèse testée. La première simulation 
procure de façon synchrone à chaque commune a une valeur r a tirée aléatoirement sui- 
vant une distribution gaussienne issus des paramètres réels : la moyenne Tq et l'écart-type 
<Tq mesurés pour l'élection de 2007. Quant à la seconde simulation, commençant par des 
résultats T a distribués aléatoirement, chaque itération attribue à une commune a tirée 
au hasard, un résultat T a provenant d'une variable aléatoire gaussienne centrée sur t^ 
et d'écart-type <Tq (avec, Tq calculé d'après les résultats simulés et <Tq issu des résultats 
réels de l'élection de 2007). Dans les deux cas, la distribution de {r a — Tq) correspond, 
conformément à l'hypothèse testée, à une gaussienne de moyenne nulle et d'écart-type égal 
à (Tq. La figure IÂ"^9l en annexe, atteste assez correctement la validité de cette hypothèse, 
même si en y regardant de près dans les zones à fortes dispersions Tq , les résultats réels 
échappent légèrement à cette règle. 

En résumé, les figures H] mettent en lumière deux régularités différentes, qui engagent 
le résultat d'une commune centrale a aux résultats des communes de son environnement : 

- en moyenne, une commune centrale a vote comme les communes environnantes, i.e. 
comme Tq ; 

- l'écart entre r a et augmente régulièrement avec l'hétérogénéité locale, <Tq, des 
résultats des communes environnantes. 

2.1.7 Corrélations temporelles 

Après avoir constaté des régularités à caractère spatial de <Tq —que nous ignorions 
jusqu'alors—, recherchons l'existence d'une éventuelle régularité à caractère temporel de 
<Tq. Plus précisément, voyons comment varie <Tq d'une élection à l'autre pour l'ensemble 
des communes a. 
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Afin de répondre quantitativement à cette question, il convient de calculer la corrélation 
de <7q d'une élection à l'autre sur l'ensemble des communes. La corrélation temporelle 
d'une grandeur X, prenant pour chaque commune a les valeurs X a (ti) et X a (tj) aux 
deux élections aux temps tj et tj, s'exprime comme 



c ti) tAx) 



(X^X-jtj)) - (X a {U)) (X*(tj)) 



où les moyennes (...) s'effectuent sur l'ensemble des communes. Ensuite, la moyenne 
des corrélations temporelles et leur déviation standard sur l'ensemble des couples 
d'élections s'évaluent respectivement comme C t (X) = ■£r'%2 i j^ i Ct i>t:j (X) et A[c t (x)] — 



La table [3] fournit les corrélations de (Jq pour chaque couple d'élections, puis leur 
moyenne et leur écart-type sur l'ensemble des couples d'élections, et enfin le rapport 
de ces deux dernières grandeurs (une sorte de rapport bruit /signal). Elle indique des 
Cti,t 3 (co)) premièrement, de valeurs relativement élevées (environ 0,6), et deuxièmement, 
assez régulières sur tous les couples d'élections différentes. <Tq montre par là un caractère 
relativement permanent, ou régulier, au cours des différentes élections. 



\. tj 

U ^\ 


1995 


2000 


2002 


2005 


2007 


1992 


0,577 


0,608 


0,606 


0,527 


0,576 


1995 




0,548 


0,541 


0,606 


0,748 


2000 






0,616 


0,487 


0,557 


2002 








0,523 


0,558 


2005 










0,614 



TAB. 3 Corrélation temporelle 
Cti,tj{&o) des <7q sur chaque couple 
d'élections (ti,tj). Moyenne Ct(<7 ) = 
0,579; écart-type A{c t (* )] = 0,060; 



^[_Ct(°-o)l 
Ci(o-o) 



0, 104. 



Une fois de plus, la régularité des valeurs mesurées à la table [3] ne prend son sens que 
placée dans son contexte. Cette table doit se comparer aux corrélations temporelles des 
résultats par commune r a , et des moyennes Tq. La table IA721 en annexe indique pour les 
résultats r Q , d'une part de fortes variations selon les couples d'élections et d'autre part 
une plus faible corrélation en moyenne. (Plus précisément, C t {j) = 0, 309, A[c t ( r )] = 0, 175 
et ~rit(T) = 0'564.) Les corrélations temporelles des t$ examinées à la table EH] (pour 

lesquelles C t {r ) = 0,399, A [Ct(ro)] = 0,226 et %° t f^ ] = 0,567) infirment l'hypothèse 
d'une grande stabilité et d'une forte corrélation temporelle des ctq qui dérivent d'un simple 
effet de lissage (par le fait de prendre en compte la valeur associée, non pas à une seule 
commune, mais à n p = 16 communes). Afin de s'en convaincre pleinement, la figure [5] 
rapporte pour Tq et ctq , définies avec un nombre variable n p de communes voisines allant 
de 4 à 128, la moyenne C t et la déviation standard Arcy de leurs corrélations temporelles 
sur l'ensemble des couples d'élections, ainsi que leur rapport. (La moyenne et la dispersion 
standard des corrélations des résultats r a ou des Tq s'estiment à partir de leur valeur 
absolue |C^t. | afin de ne pas se fourvoyer dans la convention adoptée ici, qui revient 
à considérer le résultat r ou p d'une élection en fonction du choix gagnant à l'échelle 
nationale, et ce indépendamment d'une des polarisations possibles comme les distinctions 
droite-gauche, pro ou anti-européaniste, etc., diverses et sujettes, semble-t-il, à bien des 
controverses.) 
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FlG. 5 — Moyenne des corrélations temporelles C% sur l'ensemble des couples d'élections, avec 
leur déviation standard Ar^y en barre d'erreur, évalués pour r a , Tq et o"q des résultats électoraux. 



La figure de droite visualise leur rapport, 



une sorte de rapport bruit/signal. Le nombre de 



communes, n p , intervenant dans les grandeurs Tq et (Tq (voir Eqs. (J6l[7|)), égal à 16 jusqu'alors 
varie ici de 4 à 128. Les valeurs correspondantes à r se situent, par extension, à n p = 1. 



Enfin, nous constatons aussi de plus grandes et régulières valeurs des corrélations 
temporelles des <Tq comparées à celles des (r a — Tq) ou des \r a —Tq\, (avec C t {j a — Tq) ~ 
0,24, A [Ci(T ._ ToQ)] ~ 0, 15, et C t {\r a - r a |) ~ 0,27, A [Ct(l r^\)] ^ 0,08). 

2.1.8 Une étude singulière 

Contrairement à la règle que nous avions volontairement adoptée au début de cette 
étude —celle de traiter toutes les élections de façon identique sans faire intervenir les 
spécificités inhérentes à chacune d'entre elles—, nous allons nous arrêter momentanément 
au second tour de la présidentielle de 2007. Cette partie peut se voir comme une digression 
divertissante qui renforce l'importance, si le besoin se fait encore sentir, de cXq . Le lecteur 
peut sauter sans encombre cette section, et se référer à l'annexe IB1 pour une analyse plus 
approfondie du lien entre croissance de population et (Tq . 

J'avais l'impression lorsque je collectais « à la main » les résultats des 20 arron- 
dissements de Paris de cette élection —pour compléter les données informatisées par 
commune—, que le vote pour Sarkozy ou Royal de l'arrondissement dépendait de son 
taux d'augmentation de population. Plus la population —ramenée au nombre d'électeurs 
inscrits sur les listes électorales— par arrondissement s'accroissait, plus l'arrondissement 
votait en moyenne pour Ségolène Royal. 

Éprouvons donc cette assertion pour l'ensemble des communes de France métropolitaine 
en utilisant une fois de plus la corrélation Cxy entre deux grandeurs : X a = r a , le résultat 

/ jya (2007) \ 

de la commune, et Y a = p a = ln ( j/é? ( 1992 ) ) ; le taux d'augmentation du nombre d'inscrits 

(XY)~(X).(Y) 



de la commune entre 1992 et 2007. (Rappelons l'expression Cxy = - / , 

v ^ ^ v /<x 2 >-(x> 2 . v /( y2 )-( y } 2 

où la moyenne (...) s'effectue sur l'ensemble des communes a.) 

La corrélation sur toutes les communes du résultat r et du taux d'augmentation de 
population p, aboutit à une corrélation C Tp = 0, 034. Une corrélation non seulement faible, 
voire négligeable, mais opposée à celle que j'avais entrevue. Qu'en conclure? 

- Qu'il ne faut jamais se fier à ses premières impressions, y compris dans la chose 
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politique ? 

- Qu'en politique comme ailleurs, les explications ne sauraient se satisfaire d'un vague 
discours fondé sur quelques données glanées au passage ? 

- Que la France métropolitaine ne se résume pas à Paris ? 

- Qu'il ne faut jamais prendre au sérieux les élucubrations émanant des sciences dites 
dures qui empiètent sur les sciences dites sociales? puisque, bien évidemment ces 
deux sciences étudient deux « objets » hermétiques et complètement distincts à 
l'instar des deux mondes sublunaire et supralunaire d'Aristote. 

Bref, plus sérieusement poursuivons notre questionnement. Situons de nouveau une 
grandeur dans son contexte, autrement dit calculons différentes corrélations faisant in- 
tervenir non seulement la valeur r a ou p a de la commune centrale, mais aussi celles de 
son environnement. Notons p^ et <7p , la moyenne et la déviation standard de p dans le 
voisinage V" 6 d'une commune centrale a. Elles s'obtiennent de la même façon que Tq et 
(Tq par rapport à r, i.e. en transposant dans les équations. (JHJ [7]), r par p. La table H] 
fournit quelques unes des corrélations sur l'ensemble des communes ; soit entre le résultat 
d'une commune centrale r Q et une grandeur liée à l'accroissement de population dans son 
voisinage, soit entre le taux d'augmentation d'une commune centrale p a et une grandeur 
associée aux résultats r dans son voisinage. 



X a = r a et Y a = 


p% : 0,072 


< : -0,026 


(p a - pg) : -0,019 


\p a - p% 


: 0,014 


Y a = p a et X a = 


r a : 0,069 


as : -0,290 


(r° - r a ) : -0,023 




T r o 


: -0,162 



TAB. 4 — Corrélations Cxy entre les grandeurs, X liée au résultat du second tour de la 
présidentielle de 2007, et Y liée au taux d'accroissement du nombre d'inscrits entre 1992 et 
2007. Pour mémoire : avec X a = r a et Y a = p a = ln ( ^[^j ) ' ° XY = °> 034 



Avec X a = (Tq et Y a = p a , Cxy = —0, 290 dépasse nettement, en valeur abso- 
lue, toutes les autres manières de calculer les autres corrélations de la table Hl Cette 
corrélation signifie qu'en moyenne, plus l'hétérogénéité des résultats des communes voi- 
sines à une commune centrale a diminue, plus le taux d'augmentation du nombre d'inscrits 
de la commune a entre 1992 et 2007 augmente. En d'autres termes, l'homogénéité des 
résultats augmente, en moyenne, avec l'augmentation du taux de croissance de la popula- 
tion. Autrement dit, les zones à faible taux de croissance de population ont, en moyenne, 
une forte dispersion des résultats à l'élection 2007-b. Notons aussi que la deuxième valeur 
de corrélation, en valeur absolue, de la table H] concerne X a = |r a — Tq\ et Y a = p a (avec 
Cxy = — 0, 162). Ce dernier point confirme la connexion entre <7q et \r a — Tq \ entrevue 
aux figures Hl et IA-9|. tout en accordant de nouveau (cf. les corrélations temporelles de ctq 
comparées à celles des \r a — Tq\, ou des {j a — Tq) vues à la section [2. 1.7[) la primauté de 
(Tq sur \r a — Tq\ (ou sur {j a — Tq)) pour caractériser ou étudier des résultats électoraux. 

En résumé, cette petite étude croisant les résultats du second tour de la présidentielle 
de 2007 aux taux d'augmentation de la population, renforce, à ce stade, l'importance —ici 
quelque peu inattendue, ou non intuitive— de (7q . Importance, précisons-le, ici relative au 
taux d'augmentation de population. 

Notons que l'importance de (Jq par rapport au taux d'accroissement de la popula- 
tion, peut provenir d'une relation entre ces deux grandeurs, soit directe, soit indirecte 
—car médiée par une autre grandeur intermédiaire. L'annexe [B] étudie plus rigoureuse- 
ment, certes avec les données disponibles, la relation entre <Tq de l'élection 2007 et le taux 
d'augmentation de la population de 1992 à 2007. 
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Cette digression renforce, y compris indirectement, l'importance de cTq, et s'ajoute 
aux régularités précédemment observées associées à ctq . Régularités qui concernent aussi 
bien un rapport d'une commune centrale à son environnement (voir Fig. Hj) qu'un aspect 
temporel (voir Tab. [3]). Ce qui amène naturellement à se demander pourquoi. 

2.1.9 Comprendre <Jq 

Il y aurait deux approches possibles qui permettraient de mieux comprendre les régularités 
associées à 0-q. 

La première se base sur une permanence du comportement qui régit le vote de l'électeur 
à chaque élection. Ces permanences de comportement pourraient peut-être s'apparenter à 
une généralisation, ou à une extrapolation, des observations faites en psychologie sociale 
—réalisées notamment par Sherif, Asch, Milgram et Moscovici— concernant le conformisme 
d'un individu face à un groupe plus ou moins homogène [IH1 [23]- Dans le même ordre 
d'idée, Mùller et al. [HU] attribuent au spin central, une règle qui dépend d'une sorte 
de dispersion des spins incluant son voisinage, et ce pour modéliser théoriquement la 
ségrégation des habitations selon un genre de modèle de Schelling. 

La seconde approche possible se fonde quant à elle sur une connexion de a§ à une 
« texture », à un « substrat » géographique, à des grandeurs lentement variables aux 
échelles de temps rencontrées. Les régularités spatiales et temporelles associées à <Tq pour- 
raient ensuite s'expliquer de deux manières différentes : soit <7q contiendrait des informa- 
tions à caractère politique, historique, sociologique, etc., relatives à sa zone géographique 
d'évaluation, soit au contraire, o"g brillerait par son manque total de signification poli- 
tique. Autrement dit, pourrait alors se rattacher à des données non électorales de deux 
façons possibles : soit ctq révélerait des propriétés positives (d'ordre politique et sociolo- 
gique [51 E]) du milieu géographique, soit à l'inverse, erg mesurerait un bruit (sans aucune 
signification politique), dû par exemple aux tailles finies des communes, de la façon de 
collecter les votes via une répartition spatiale en communes, etc. 

Inutile de dire que cette étude n'aspire pas à trancher entre ces deux approches pos- 
sibles —qui ne s'excluent d'ailleurs pas obligatoirement—, mais cherche à mieux appréhender 
erg par les questions qu'elle soulève. Quelle démarche adopter alors ? 

Pour commencer, nous privilégions la seconde approche, puis chercherons à la tester 
avec les données disponibles. Si les données dont nous disposons ne permettent pas de 
valider la seconde approche, alors nous nous tournerons vers la première. Autrement dit, 
une fois soulevée la question de l'origine plausible de <7q —qui dépasse le cadre de cette 
étude—, nous cherchons, comme de coutume en science, une relation forte entre cXq et une 
autre grandeur mesurable. Et nous nous en contenterons si nous parvenons à établir cette 
relation. 

Il reste donc à savoir quelles données non électorales, variant peu à l'échelle de temps 
considéré (entre 1992 et 2007), utiliser. Actuellement nous ne possédons que la population, 
la surface, l'altitude et la position géographique, comme seules données non électorales 
par commune. La table BJ la figure IA-21 et bien évidemment la figure EJ attestent d'un 
lien entre la population et les résultats électoraux, ce qui nous incite à poursuivre dans 
cette voie. En outre, rechercher un éventuel lien entre <7q et la population permet de se 
confronter à l'une des sources potentielles du bruit : celle que cTq contiendrait sous forme 
de bruit statistique dû aux effets de tailles finies des communes. 
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Remarquons au préalable que la population se ramène tout le long de cette étude au 
nombre d'inscrits sur les listes électorales, et ce sans se préoccuper, dans l'immédiat, de 
questions connexes. Puisque ctq fait intervenir n p communes de l'environnement V° 6 d'une 
commune centrale a (voir Eq. (J7j)), la population de V" 6 se définit directement comme la 
population sur la couronne des n p communes : 

N a = N? (9) 

insc, cour / j insc " V / 

/9eVf 6 

Les figures M reportent cXq en fonction de la taille de la population, et permettent 
donc de voir facilement la relation entre ces deux grandeurs. Afin de jauger la présence 
d'un bruit dû aux effets de tailles finies des communes (ou des bureaux de vote), nous 
comparons les courbes issues des résultats réels à celle dérivant d'une simulation binomiale 
(cf. Eq. ([ïï]) et section l2".1.2p . et accessoirement, à celle provenant du « modèle zéro » (cf. 
Eq. (jl]) et section [2.1.3p . Voyons maintenant les réponses apportées par les figures El aux 
questions posées plus haut. 

Ces figures fournissent deux éléments de réponse puisqu'elles montrent clairement : 

- une forte correspondance entre la taille de la population et a$ ; 

- la présence de bruit dû aux tailles finies dans <Tq, excepté dans les zones à forte 
population. 

Nous nous satisfaisons de ces réponses et ne poursuivrons donc pas nos investigations à la 
recherche de règles comportementales des électeurs, associées à la dispersion des résultats 
dans le voisinage d'une commune centrale —sans pour autant se positionner sur l'existence 
ou non de ces règles. 

Mais revenons aux figures El La présence du bruit dû aux tailles finies, hormis les zones 
des plus fortes populations, se décèle par l'allure similaire des courbes réelles et celles 
issues d'un tirage binomial de même probabilité p. Les courbes réelles et celle provenant 
du tirage binomial ont en effet sensiblement les mêmes exposants des lois de puissance 
de ctq en fonction de N? nsc cour . Quelques remarques néanmoins. La loi de puissance, 
ctq oc t/v^ — " — W7î2 , obtenue pour la distribution binomiale, diffère de celle attendue, (Tq oc 

\ insc, cour > 

-, 1 =, à cause de l'inhomogénéité en taille de la répartition spatiale des communes, 

y insc, cour 

et à plus forte raison des bureaux de vote. Notons aussi que la courbe obtenue avec 
le « modèle zéro » se distingue nettement des courbes réelles, à cause, probablement, 
de l'état de corrélation des votes à l'intérieur des communes d'un même voisinage. (Le 
« modèle zéro » part en effet de l'hypothèse des votes indépendants à l'intérieur d'une 
commune, et aussi, entre différentes communes.) La courbe relative à l'élection de 2000 
se situe au dessus des autres, à cause de son faible nombre de suffrages exprimés (N expr ~ 
0, 25 N insc ) à l'aune des autres élections. Mais cet argument ne tient pas pour comparer 
les autres élections entre elles. Bien d'autres informations peuvent s'extraire des figures El 
—notamment l'irrégularité des comportements dans les zones à forte population—, mais 
comme nous le disions en préambule, la présente investigation concerne les régularités, et 
les régularités seulement. Que cela nous suffise pour l'instant. 

2.1.10 Des régularités expliquées 

Voyons pourquoi les précédentes régularités associées à <7g s'expliquent par la forte 
connexion entre la taille de la population et Uq . 
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FlG. 6 - Moyenne des <7g en fonction de N^ sc cour , calculé avec 36 intervalles. <Tq s'évalue à 
partir des résultats par commune, à gauche, et des résultats par bureau de vote, à droite. Les 
tirages aléatoires binomiaux, le « modèle zéro » et le mélange aléatoire des résultats s'effectuent 
à partir des valeurs réelles de l'élection 2007-b. 



Puisque la population des communes varie faiblement d'une élection à l'autre, <Tq garde 
d'une élection à l'autre, approximativement la même valeur —à un décalage global près- 
sur sa zone d'évaluation (voir Fig. E]). Ainsi, se comprennent la corrélation temporelle 
assez forte des <Tq , ainsi que leur faible variation d'une élection à l'autre (voir Tab. [ïï]). 

Puisque autour d'une commune a de taille donnée se trouvent en moyenne d'autres 
communes de même taille p3] (voir aussi Figs. IA-41 et LA-101) . le bruit statistique dû aux 
tailles finies possède la même intensité moyenne, aussi bien pour la commune centrale a 
que pour celles de son environnement. Ainsi, se justifie plus aisément la variation régulière 
de \r a — Tq \ en fonction de cJq (voir Fig. Hl-f). 

Enfin, puisque le taux de croissance de la population augmente avec la taille de la 
population [Ï5] (voir aussi l'annexe IBl) . <Tq se trouve donc indirectement —et donc dans 
une moindre mesure— relié au taux de croissance de la population. L'anti-corrélation 
entre cTq et le taux d'augmentation de population (voir Tab. H]) s'éclaire de la même 
façon, à savoir : plus la taille de la population augmente (et donc plus <Tq diminue, en 
moyenne), plus le taux de croissance de population augmente. (L'annexe IBl étudie plus 
scrupuleusement la relation entre et le taux d'augmentation de population, purgée de 
leur connexion indirecte via la taille de la population.) 

En outre et à titre anecdotique, se clarine l'apparente irrégularité des courbes de la 
figure Hl-d, où les élections des années 1992 et 2000 se différencient nettement des autres. 
La figure |Aj2] indique un comportement similaire pour les élections de 1992 et de 2000 : à 
la différence des autres élections, le résultat r a d'une commune croît en moyenne quand 
le nombre de suffrages exprimés, et donc sa taille de population, augmente. {N" nsc cour 
et le nombre d'inscrits N^ nsc par commune centrale a varient de concert, à cause de la 
répartition spatiale de la population [15J (voir aussi Figs. IA-41 et IA-10Q ). Ainsi, r Q et 
(7q peuvent de nouveau se retrouver indirectement connectés, et ce via la taille de la 
population. Et pour les élections de 2000 et de 2005, quand la population augmente, r a 
augmente et (Tq diminue, ce qui implique la décroissance de r a pour la croissance de <Tq 
comme le montre la figure 0]-d. 
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2.1.11 



Du bruit dans <7q 



Nous voulons ici quantifier l'accointance de <Tq avec la taille de la population (voir 
Fig. [6]) et, plus précisément encore, avec le bruit statistique dû aux tailles finies des 
communes (ou des bureaux de vote). 

Nous commençons pour cela, par rechercher l'expression mathématique du bruit sta- 
tistique occasionné par les tailles finies de population. N'ayant pas de modèle de vote à 
l'échelle de la commune, ou entre plusieurs communes avoisinantes, nous nous référons 
au bruit statistique binomial dû aux tailles finies. Le rapprochement d'allure entre les 
courbes réelles et celles issues du tirage binomial dans les figures [6] conforte notre posi- 
tion, à savoir : se référer au bruit statistique binomial pour décrire le bruit statistique dû 
aux tailles finies des résultats réels contenu dans ctq . 



Selon un tirage binomial (cf. Eq. (jHJ) et section 12.1.2p . l'écart-type des réalisations 
possibles pour une commune (ou pour un bureau de vote) avec N" xpr suffrages exprimés, 

s'écrit comme S . En considérant des petites fluctuations, et en négligeant l'asymétrie 

(ou skewness) de la distribution binomiale, le résultat p a d'une commune (ou d'un bureau 
de vote) a avec N" xpr suffrages exprimés devient selon une simulation binomiale : p a ~ 



p + 



s/ 



£ a , où dénote une réalisation d'une distribution £, de moyenne nulle et 



de variance unité, gaussienne par simplicité. Le changement de variable par, donné par 
l'équation (j2j), implique r a ~ r + 



,_ — £ Q , où t = ln(r^=). La variance engendrée 
par les communes (ou bureaux de vote) du voisinage V" 6 d'une commune centrale devient 



selon l'hypothèse d'un tirage binomial, 



(^) 2 i \ 

P(l-P) JV^'^ie ~ p(1-p)\at, 



1 / 1 \ 



Il convient alors d'introduire la grandeur irf nsc définie par : 



7T. 



insc, 



• pev? 



\ 



II 



E 



m 



(10) 



qui relie la façon dont la population se répartit sur l'environnement V° 6 autour d'une 
commune centrale a, au bruit statistique binomial dû aux tailles finies des populations. 
(Quand irf nsc se calculera non pas à partir des populations des communes, mais à partir 
des populations des bureaux de vote, il suffira de remplacer dans le membre de droite, 
n p par le nombre de bureaux de vote contenus dans la zone Vf 6 .) Bien que nous aurions 
dû par souci de rigueur définir une grandeur relative aux N@ (et non pas aux N^ nsc ), 
nous avons néanmoins opté pour 7r^ sc associée au nombre d'inscrits, puisque, d'une part, 
cette grandeur fait directement intervenir la population des communes qui varie peu d'une 
élection à l'autre, et d'autre part, elle engendre une différence négligeable sur les résultats 
des corrélations qui suivront. 

A titre indicatif, un « modèle zéro » —bâti sur l'hypothèse d'un vote, ni corrélé à 
l'intérieur d'une commune, ni entre communes avoisinantes— appliqué aux inscrits et non 
pas aux nombres de suffrages exprimés, donnerait : 



V 



7T 



insc, 0/ 



— 



7T 



insc, 0/ 



p(i-p) 

La figure lÀTÏTl en annexe montre les corrélations spatiales de n insCt , et de son équivalent 
pour une seule commune, à savoir -, 1 , toutes deux pour les données de l'élection 2007- 
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0,8 



0.8 





FlG. 7 - Moyenne des o"q des résultats électoraux en fonction de iïf nsc calculé avec 36 inter- 
valles, évalués conjointement par commune à gauche, et par bureau de vote à droite. Les tirages 
aléatoires binomiaux, le « modèle zéro » et le mélange aléatoire des résultats s'effectuent à partir 
des valeurs réelles de l'élection 2007-b. 



b. Il ressort une étonnante similarité des corrélations spatiales des résultats réels (cf. 
Fig. El) avec celle de -7= — , corroborée par la similarité des corrélations spatiales des t% 
des résultats électoraux (cf. Fig. IA-51) avec celles des irf nac . 

Les figures [7] représentent, pour chaque élection, cTq en fonction de Tr° nsc , calculés tous 
deux à partir des données par commune, et si possible, par bureau de vote. Comme de 
coutume, s'y ajoutent les courbes issues des tirages binomiaux, du « modèle zéro » et enfin 
du mélange aléatoire des résultats, dérivés touts trois des données réelles des résultats de 
l'élection 2007-b. Nous y voyons une nette confirmation de la relation entre cXq et le bruit 
statistique binomial dû aux tailles finies. L'écart entre les courbes réelles et le « modèle 
zéro » devient patent (comme aux figures EJ), ce qui accrédite de nouveau l'existence des 
corrélations intercommunales des communes avoisinantes. Notons enfin que la pente des 
erg pour l'année 2007 prend une valeur supérieure à celles provenant du tirage binomial 
correspondant. Ce dernier constat provient, probablement, de la présence des corrélations 
intercommunales, mais nous ne savons pas l'expliquer davantage. 

Afin de quantifier l'accord entre <Jq et le bruit statistique binomial dû aux tailles fi- 
nies des communes (ou des bureaux de vote), il suffit, d'après ce qui précède, de corréler 
ctq à Ttf nsc . Les valeurs correspondantes (obtenues à la table [5]) peuvent se confron- 
ter au cas d'un bruit binomial pur affectant à chaque commune a un résultat p a = 
Binomial(p; ) (où p provient de la moyenne des résultats réels p a de l'élection 
considérée, et calculés à la table \KÂ\ comme le montrait la section [2.1.2p . Cette table 
indique les valeurs moyennes et les dispersions standards évaluées sur l'ensemble des 
élections traitées. (Même s'il semble ridicule de s'échiner à calculer des moyennes et des 
écarts- types sur un ensemble de 6 valeurs à peine, ces calculs prendront plus de significa- 
tion ultérieurement.) 

La table El relative aux données par commune, corrobore les précédentes observations 
tirées des figures M et d à savoir une connexion forte entre cXq et la taille de la population, 
et plus particulièrement des corrélations entre <Tq et irf nsc : 

- d'assez fortes valeurs (aux alentours de 0, 7) ; 

- relativement permanentes d'une élection à l'autre. 

Les données associées aux bureaux de vote témoignent, quant à elles, d'une plus grande 
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1992 


1995 


2000 


2002 


2005 


2007 


com. 
bur. 


0,722 


0,632 


0,783 
0,775 


0,719 
0,719 


0,591 
0,472 


0,664 
0,602 



TAB. 5 — Corrélations Cxy pour chaque élection sur l'ensemble des communes, entre la disper- 
sion des résultats X e " = a§ et Y a = irf nsc . <7q et ftf nsc se calculent soit à partir des valeurs 
par commune (com.), soit à partir des valeurs par bureaux de vote (bur.). Pour les communes et 
sur l'ensemble des élections : Cxy = 0, 685 ± 0, 069. (Par comparaison, avec un tirage binomial 
(voir texte) sur les données par commune, Cxy = 0, 827 ± 0, 013 ; et sur les données par bureau 
de vote, C X y = 0, 829 ± 0, 025.) 

irrégularité, probablement fort intéressante et significative, mais volontairement délaissée 
dans cette section. 

2.1.12 « Séparer le bon grain de l'ivraie » 

Faut-il conclure de la présence d'un bruit dans (comme l'attestent les figures El [7] 
et Tab. [5]) que (Tq mesure uniquement un bruit dû aux tailles finies des communes (ou 
des bureaux de vote), et ne reflète par là même aucune information locale à caractère 
positif? Nous appelons information locale à caractère positif, une propriété inhérente à 
la zone géographique où se calcule Uq, qui ressort des considérations d'ordre politique, 
sociologique, historique, comportementale, etc. Bref, qui ressort de toute spécificité locale 
différente de celle que lui confère la répartition de la population dans cette zone au travers 
d'un bruit dû aux tailles finies. 

Nous partons du présupposé qu'une information spécifiquement locale, à caractère dit 
positif, se retrouve identiquement exprimée dans <Tq à chaque élection. Mais qu'importe 
le présupposé, nous cherchons à proprement parler, non pas la présence d'une informa- 
tion locale à caractère positif telle qu'elle puisse se manifester dans <Tq à une élection 
donnée, mais plutôt une information locale —dite, faute de mieux, à caractère positif— 
que manifeste la régularité temporelle de <Tq à diverses élections. En d'autres termes, nous 
cherchons à déceler la présence d'une propriété locale autour d'une commune centrale a, 
qui se répercute par les régularités de ctq à différentes élections. 

Bien évidemment, nous ne nous interrogeons nullement sur la nature de cette informa- 
tion locale, mais nous nous contenterons uniquement d'essayer de la mesurer, y compris a 
minima. Nous tenterons du mieux possible d'évaluer dans quelle proportion —minimale- 
cette information locale contribue à la permanence temporelle des (Tq (voir Tab. [ïï]). Nous 
essaierons ensuite de comprendre pourquoi, de par son expression mathématique, 
contient une information locale. Enfin, à titre indicatif, nous illustrerons par une carte les 
zones à plus ou moins forte régularité temporelle des <Tq . 

Ces développements se trouvent à l'annexe O Mais auparavant, expliquons mieux le 
problème et notre façon d'opérer. 

De par sa définition même (cf. Eq. ([7])), <Jq mesure directement la dispersion des 
résultats électoraux à l'intérieur de sa zone géographique V" 6 —les n p = 16 plus proches 
communes de la commune centrale a. Les faibles valeurs de <7q indiquent des zones à 
forte homogénéité des résultats électoraux, tandis que les fortes valeurs de o"q pointent 
les zones de forte fracture, ou d'hétérogénéité, des résultats électoraux. Mais nous savons 
également que <Jq dépend fortement de la taille des communes. L'existence d'un bruit 



29 



statistique dû aux tailles finies des communes implique à lui seul, des fortes valeurs de 
<Tq dans les zones à faible population, et inversement dans les zones fortement peuplées. 
Cela se traduit par une permanence temporelle des <Tq , mesurée par la corrélation des ctq 
à différentes élections (cf. Eq. ([H]) et section [2.1.7p . telle que C t (cro) — 0, 69 avec un tirage 
binomial des résultats, et C t ((Jo) ~ 0, 14 avec des résultats issus du « modèle zéro ». (Pour 
mémoire, C t (<Jo) — 0,58 (voir Tab. [3]) pour les résultats réels des six élections étudiées.) 
Bref, tout ceci appelle à se poser la question suivante : comment parvenir à identifier d'une 
valeur de <Tq ou, mieux, d'une série de valeurs de <Tq , une propriété à caractère positif et 
non entachée de bruit statistique dû aux tailles finies des communes (ou des bureaux de 
vote) ? 

Prenons un exemple pour mieux comprendre. Supposons que les données électorales 
s'accordent avec le « modèle zéro »— traité à la section |2".1.3I et donné par l'équation (J3j). 
Connaissant 7r" nsc et en utilisant l'équation (TTT1) . nous pourrions en déduire pour chaque 
élection l'amplitude du bruit à l'intérieur de la zone Vf 6 . ctq contient du bruit dû aux 
tailles finies des communes, à la différence de qui n'en contient pas. caractérise 
donc une information ou grandeur locale lors de l'élection traitée. Une information locale 
à une élection donnée que nous pourrions ensuite exploiter. Il y a maintenant un pas à 
franchir entre, d'une part, une information locale, à une élection donnée, non entachée 
de bruit statistique dû aux tailles finies des communes, et d'autre part, une information 
locale pérenne. Dans le cas du « modèle zéro », a% provient des fluctuations d'un bruit, 
et ne possède donc pas le caractère d'information locale pérenne que nous recherchons. 
Autrement dit, varie aléatoirement d'une élection à une autre, et ne reflète aucune 
particularité locale à caractère dit positif. Concrètement, nous vérifierions le caractère 
non permanent de a® au travers de ses corrélations temporelles, Cti^a^), sur tous les 
couples d'élections. 

L'exemple du « modèle zéro » ayant permis d'éclaircir nos propos, passons aux résultats 
électoraux réels qui, comme nous le savons, ne s'accordent pas à ce modèle. Les résultats 
électoraux à l'intérieur de la zone géographique Vf 6 des n p communes ne constituent pas 
en effet des variables indépendantes les unes des autres (cf. notamment la moyenne des 
r a en fonction Tq de Fig HJ-a et les corrélations entre proches communes C(R ~ 1) de 
Fig. [3]), ni à l'intérieur des villes pour leurs bureaux de vote (cf. l'annexe iDl). L'état de 
la corrélation entre les communes à l'intérieur de la zone pourrait fournir une —parmi 
tant d'autres— information locale associée à cette zone géographique. Mais il subsiste un 
problème majeur : nous ne savons pas remonter de cTq à ces corrélations en l'absence de 
modèle de vote. En d'autres termes, en l'absence de modèle de vote à l'échelle des com- 
munes, voire infr a- communale, nous ne savons pas extirper de (Tq , le bruit dû aux tailles 
finies. (A l'annexe [O, nous tenterons néanmoins d'estimer indirectement les corrélations 
intercommunales, par comparaison des (Jq réels avec des <7q virtuellement produits lors 
d'une absence de corrélation intercommunale.) 

Nous allons tenter de contourner le problème et l'attaquer par un autre biais, en se 
focalisant sur son aspect temporel. Nous partons pour cela du présupposé suivant : une 
fois détachée du bruit résiduel, l'information locale se manifeste par une permanence tem- 
porelle. Nous voulons donc nous intéresser à la partie pérenne que témoigne à toutes les 
élections ctq ôté du bruit statistique des tailles finies, et qui exprime ce que nous appelons, 
peut-être à tort, information locale à caractère positif. Par exemple, si <7q d'une commune 
a donnée présente pour chaque élection une valeur bien supérieure (ou inférieure) com- 
parée aux autres valeurs des zones à population similaire, alors, nous en déduisons que 
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la zone géographique sur laquelle s'évalue cXq recèle d'une information locale et pérenne. 
Cet exemple nous montre comment une information partielle, et pérenne, peut se déceler 
au travers des <Tq : 

- en se référant à d'autres zones comparables —en terme de bruit dû aux tailles 
finies— ; 

- en tenant compte d'une série d'élections. 

Une façon de filtrer le bruit statistique dû aux tailles finies consiste alors à compa- 
rer —ou plus précisément à faire des corrélations—, à différentes élections, des <Tq ayant 
entre eux la même intensité de ce bruit statistique. Ce bruit statistique, d'une égale va- 
leur —aux fluctuations près— pour le groupe de communes centrales considérées, n'aura 
alors plus d'effet sur les corrélations temporelles de leur erg à différentes élections. Nous 
pouvons alors accéder par ce biais à une information locale, à caractères positif et pérenne. 

L'annexe ICI essaie de détecter, puis de mesurer, la présence de l'information locale à 
caractère positif que contient <Tq, et ce de différentes façons. Elle développe pour cela, 
l'argumentation qui précède. Il ressort que la partie pérenne de <Tq filtré du bruit statis- 
tique des tailles finies, contribue pour un minimum de 15% à la permanence temporelle 
globale des <Tq (mesurée par C t ((Jo)). Ensuite, elle tente de mesurer l'état des corrélations 
des résultats r des communes (ou des bureaux de vote) à une hypothétique grandeur 
locale, puisque, selon la discussion précédente, l'information locale positive peut aussi se 
comprendre par l'état des corrélations intercommunales. L'annexe indique aussi que, glo- 
balement, ladite information locale positive se manifeste davantage dans les zones à forte 
population. Enfin, et à titre anecdotique, l'annexe représente la position des communes 
centrales a ayant une plus ou moins grande variation relative de leurs <Tq à différentes 
élections. 

2.1.13 Critique inspirée de « la possibilité de la mesure crée le phénomène » 

Avant de conclure ce chapitre, nous nous servirons de cette belle assertion de Lionel 
Tabourier [81] —sans nous questionner sur ce qui, à son tour, initie la possibilité de la 
mesure— pour critiquer les régularités observées liées à <Tq , dont l'origine se situe essen- 
tiellement dans leur imbrication avec des valeurs de population, n^ nsc en l'occurrence. 

Premièrement, une lapalissade où il n'y a pas de quoi véritablement s'exciter. Nous 
avons pu croiser les valeurs ctq à ir? nsc parce que nous disposions des données permet- 
tant de le faire. Nous n'affirmons pas en revanche que nf nsc recèle de la plus grande 
affinité avec ctq . Dit autrement, nous n'affirmons pas, par exemple, qu'il ne puisse exis- 
ter de meilleure corrélation entre <Tq et une autre grandeur, que celle entre <Tq et n^ nsc . 
Nous n'affirmons pas non plus que la corrélation entre <Tq et iïf nsc fournisse le plus d'in- 
formation à caractère politique, sociologique, etc. —dit en un mot, positif—, sur la zone 
géographique où s'évalue <Tq. Néanmoins, les tables H] et [5] montrent une meilleure conni- 
vence de <7q avec nf nsc , qu'avec le taux d'augmentation de population. Nous aurions pu 
aussi croiser <Tq à la densité de population, mais cette dernière grandeur capture moins 
clairement le bruit statistique dû aux tailles finies, que celle provenant directement des 
populations. De futures études cherchant à savoir comment <Tq se corrèle à des grandeurs 
directement issues des champs économiques, sociaux, etc., enrichiraient très certainement 
l'analyse des résultats électoraux —surtout dans les zones à forte population, dans les- 
quelles les propriétés dites positives se manifestent davantage dans <7q (voir Figs. IC-ll et 
IC-21) . L'annexe IB1 montre une façon de déceler une information dite positive qui, de plus, 
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se lie en partie au bruit statistique des tailles finies. (Elle cherche à déceler la relation 
directe entre le taux de croissance de la population et <Tq , et ce sans la connexion indirecte 
avec le bruit dû aux tailles finies exprimé par vr^ sc .) 

Mais revenons à la possibilité de mesurer <Tq et itf nsc et plus particulièrement au rôle 
des appareils de mesure, ou mieux, des échelles de mesure. Les figures |6] et [7] ainsi que 
la table [5] permettent de confronter l'effet occasionné par deux différents « appareils de 
mesure »des choix des électeurs et de la taille des populations : les communes et les bureaux 
de vote. (La différence entre ces deux appareils de mesure n'intervient bien évidemment 
que pour les plus grandes communes, i.e. celles qui possèdent plus d'un bureau de vote.) 
L'effet majeur introduit par ces deux échelles de mesure différentes, consiste à amplifier 
l'écart par rapport au comportement bruité « normal ». Dit autrement, l'échelle du bureau 
de vote, par rapport à celle de la commune, permet de voir plus finement si les <Tg d'une 
élection se démarquent du bruit statistique dû aux tailles finies —et qui témoignent de la 
sorte d'une plus grande richesse, en terme de signification politique, sociologique, etc. 

Enfin, plus intéressant encore, la possibilité de comparer entre elles des élections de 
natures différentes et portant sur des questions différentes (voir Tab. [Q nous incite à 
réfléchir un peu plus sur la signification à accorder aux grandeurs électorales. Les résultats 
T a ou Tq auraient pu de façon bien surprenante exhiber de fortes et régulières valeurs de 
corrélations temporelles entre de si disparates élections (cf. Tabs. [Â"^2l et IA-3P . Il eût fallu 
pour cela, éventuellement, ne considérer que des élections portant sur des choix similaires, 
ou ne traiter que des résultats d'un même parti politique aux différentes élections. (Notons 
néanmoins que la table IA-31 relative aux corrélations temporelles des Tq, contient des 
informations à caractère politique. Elle fournit en effet pour chaque couple d'élections, 
outre le signe d'une corrélation ou d' anticorrélation (avec la convention d'attribuer au 
résultat électoral, la valeur du choix vainqueur à l'échelle nationale), mais aussi des valeurs 
absolues généralement, soit grandes (supérieures à environ 1/2), soit faibles (inférieures à 
environ 1/10, voire proches de zéro).) Comme nous pouvions nous y attendre, la régularité 
temporelle des o"q ( c f- Tab. [ïï]) à des élections différentes en nature et en choix provient alors 
non pas de leurs récurrentes propriétés politiques, mais, au contraire, de leur absence de 
signification politique, bref de leur bruit statistique attaché aux tailles finies de population. 
Il faut cependant nuancer cette affirmation, puisque les régularités temporelles de <Tq 
procèdent aussi de la spécificité à caractère positif (i.e. ne traduisant pas le bruit statistique 
dû aux tailles finies) inhérente à leur zone géographique (cf. annexe ICI) . 



2.1.14 Résumé 

En résumé, cette partie a mis en évidence les principaux points et régularités suivants. 

- Il convient d'utiliser une variable non bornée pour mesurer les résultats électoraux 
binaires, comme par exemple r (voir Eq. (j2J)), afin d'étudier leurs régularités (voir 
Tab. [2] et Fig. [T] à comparer avec Tab. IA-11 et Fig. IA-11) . 

- Les résultats électoraux par commune présentent une corrélation spatiale, d'une 
part relativement forte à courte distance, et d'autre part à longue portée avec une 
décroissance quasi- logarithmique (voir Fig. [3]). 

- Une analyse plus fine de la connexion entre le résultat d'une commune centrale a et 
les communes de son voisinage révèle deux régularités : la commune centrale vote 
en moyenne comme son environnement (r Q ~ Tq), et l'écart entre ces deux valeurs, 
\r a — Tq\, augmente régulièrement avec la dispersion <Tq des résultats des communes 
de son environnement (voir Fig. H] et Eqs. (0, [?])). 
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- (Tq possède une forte régularité temporelle, à la différence d'autres grandeurs liées 
aux résultats électoraux comme r a et Tq (voir Tabs. IA-21 et lï^3l) . 

- ctq atteste une forte connexion avec la taille de la population (voir FigJHD, ce qui 
explique, en partie, les diverses régularités associées à <Jq. 

- Ctq traduit non seulement la présence d'un bruit dû aux tailles finies des communes 
ou des bureaux de vote (voir Fig. [7] et Tab. [5]), mais aussi une information posi- 
tive inhérente à sa zone géographique, vraisemblablement à caractère politique ou 
sociologique, et dite positive (voir annexe . 

Signalons aussi que l'annexe IDl étudie l'indépendance des résultats électoraux des bu- 
reaux de vote au sein d'une même ville, ou dans les zones urbaines, et montre —en accord 
avec ce qui précède— leur forte corrélation. 

Enrichissons cette étude en se confrontant à une autre forme de choix binaire du 
domaine électoral, et virtuellement plus simple que le précédent : s'abstenir ou non à 
une élection. Nous chercherons notamment à vérifier si les points ci-dessus restent encore 
valables pour les taux de participation aux élections. 
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2.2 Le taux de participation des élections nationales 

Où l'on voit que, pressé par le temps, le lecteur avisé pouvait survoler 
cette partie. 

2.2.1 Vue d'ensemble 

Poursuivons ce travail par l'étude d'une autre attitude binaire associée aux élections : 
ou bien l'électeur inscrit sur les listes électorales se déplace à son bureau de vote et opine 
en faveur de l'un des choix proposés —voire appose un bulletin blanc ou nul—, ou bien il 
ne participe pas à l'élection. 

Les raisons de simplicité entrevues précédemment dictent les mêmes restrictions : 
premièrement, ne considérer que les élections portant sur le même choix à l'échelle na- 
tionale, et deuxièmement, se limiter aux données de la France métropolitaine. Ainsi, les 
élections analysées pour leurs taux de participation (voir Tab. [U]) concernent aussi bien 
celles à choix multiple^ que celles à choix binaire —précédemment analysées quant à leurs 
résultats. 

Outre, d'un côté, l'engagement physique de l'individu mesuré par le taux de partici- 
pation, et de l'autre côté, la mesure d'une opinion potentiellement labile [H], ces deux 
mesures possèdent une différence essentielle liée à un point déjà soulevé à la section 12.1.131 
Les taux de participation se réfèrent à la même question (participer ou non à l'élection 
donnée) pour les 12 élections traitées, tandis que les résultats des 6 élections binaires ana- 
lysées précédemment se calculent à partir de questions différentes (cf. les choix proposés 
aux électeurs de la table. [T]). 



Année 


choix 


type d'élection 


inscrits 


moyenne 


1992 


binaire 


référendum, traité de Maastricht 


36,6 10 6 


0,713 


1994 


multiple 


européennes 


37,6 10 6 


0,539 


1995 


multiple 


présidentielle, premier tour 


38,4 10 6 


0,795 


1995 


binaire 


présidentielle, second tour 


38,4 10 6 


0,805 


1999 


multiple 


européennes 


38,4 10 6 


0,478 


2000 


binaire 


référendum, quinquennat présidentiel 


38,2 10 6 


0,308 


2002 


multiple 


présidentielle, premier tour 


39,2 10 6 


0,729 


2002 


binaire 


présidentielle, second tour 


39,2 10 6 


0,810 


2004 


multiple 


européennes 


39,9 10 6 


0,434 


2005 


binaire 


référendum, traité constitutionnel européen 


39,7 10 6 


0,711 


2007 


multiple 


présidentielle, premier tour 


41,9 10 6 


0,854 


2007 


binaire 


présidentielle, second tour 


41,9 10 6 


0,853 



TAB. 6 — Élections nationales analysées pour leurs taux de participation. Le nombre d'inscrits 
et la moyenne du taux de participation se réfèrent à la France métropolitaine. 



En résumé, l'étude des taux de participation semble plus facile que celle des résultats 
électoraux pour les raisons suivantes : 

- un plus grand nombre de données (12 élections connues pour leurs taux de partici- 
pation, comparé à 6, pour leurs résultats électoraux) ; 

5 Depuis 2004, les élections européennes présentent sept listes différentes pour la France métropolitaine. 
Les différences entre ces sept listes régionales portent uniquement sur la présence des plus petits partis 
et le nom des tête de listes des autres partis. Sans trop commettre d'erreur, nous assimilons donc leur 
taux de participation à ceux issus d'élections portant sur le même choix à l'échelle nationale. 
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- les choix, de s'abstenir ou non lors des différentes élections, paraissent plus ho- 
mogènes entre eux que les différents choix associés aux expressions des votes ; 

- un choix à prendre par l'électeur, semble-t-il, plus simple —car un choix qui engage 
moins l'électeur, ou qui suscite moins de clivage, de positionnement, d'attente, etc., 
idéologique— pour la participation à une élection, comparé à celui de l'expression 
du vote. 

Bien que l'étude des régularités paraisse plus facile pour les taux de participation par 
rapport aux résultats électoraux, la précédente étude a eu néanmoins le grand mérite 
de détacher assez nettement certaines spécificités électorales —comme l'importance de 
l'hétérogénéité des résultat <7q sur une zone géographique. 

Bref, il importe maintenant de se pencher sur cette autre source de données électorales 
—les taux de participation aux élections— et de savoir ce qu'elle apporte de nouveau. Et 
notamment, infirmera-t-elle, ou confirmera-t-elle les précédentes régularités dégagées de 
l'étude des résultats électoraux ? 

Le taux de participation de la commune (ou du bureau de vote) a s'écrit comme 
p a = jkr^-, et en grandeur r (voir Eq. (j2J)) comme r a = ln( „„ ) ; où N^ nsc et 

insc irise vot 

N" ot désignent respectivement le nombre d'électeurs inscrits sur la liste électorale de la 
commune (ou du bureau de vote) a, et le nombre d'électeurs de a qui ont voté à l'élection 
considérée. Comme précédemment, nous convenons de modifier N" ot d'une demi-voix dans 
les deux cas extrêmes (N^ = N« sc - N« t = N« nsc - 0, 5 et N« t = - N% ot = 0,5) 
pour éviter que r a devienne infini. 

Les figures [8] représentent les histogrammes, centrés sur leur moyenne, de l'ensemble 
des taux de participation r a par commune (ou par bureau de vote). La table [7] fournit 
des statistiques élémentaires de la distribution des taux de participation par commune 
t q , et si possible, par bureau de vote. Les histogrammes et statistiques en grandeur p se 
trouvent en appendice (cf. Fig. IA-121 et Tab. IA-41) . De nouveau, les histogrammes et sta- 
tistiques associés aux taux de participation confirment l'avantage d'utiliser une grandeur 
non bornée, comme r, si l'on se préoccupe de régularités. 

Mais plus important encore, la distribution des taux de participation r a par commune 
(ou par bureau de vote) semble particulièrement permanente, similaire, d'une élection 
à une autre. Ceci se traduit quantitativement par des écarts-types de r par commune 
(ou bien par bureau de vote), sensiblement égaux pour chacune des 12 élections, et 
ce indépendamment des taux de participation moyen —qui s'étend de 31% à 86% (voir 
Tabs. El E]). Noter que les écarts-types en grandeur r des résultats (~ 0,49) dépassent 
ceux des taux de participation (~ 0,38), ce qui tend à accréditer le type de classement 
retenu ici des choix binaires : entre d'un côté, celui d'un vote entre deux alternatives, et 
d'un autre côté, participer ou non à l'élection —et dans les deux cas, sans tenir compte 
ni de l'enjeu ni de la nature des élections. 

Notons enfin une dissymétrie (skewness) en grandeur r toujours positive, sur laquelle 
nous reviendrons ultérieurement. 

Les figures [9] et IA- 131 tracent respectivement l'écart-type et la moyenne de r a à 
l'intérieur de 36 intervalles en N^ nsc et peuvent se comparer à leurs homologues (Figs. [2] et 
IA-21) associées aux résultats des élections. Les conclusions de la section 12.1.21 s'appliquent 
également aux taux de participation, soit plus précisément : d'une part les taux de parti- 
cipations diffèrent d'un processus aléatoire, indépendant et identique à l'échelle nationale 
(i.e. un tirage binomial à probabilité p uniforme), et d'autre part un assez bon accord, 
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FlG. 8 — Histogrammes des taux de participation r ramenés à une moyenne nulle, des communes 
à gauche et des bureaux de vote à droite. La lettre b (ou m) ajoutée à l'année précise la nature 
binaire (ou multiple) l'élection. Ces légendes s'appliqueront aux élections équivalentes des figures 
qui suivront. 



7 

Election 


com. 


moy 


éc-typ 


skew 


kurt 


bur. 


moy 


éc-typ 


skew 


kurt 


1992-b 


36186 


1,13 


0,355 


1,05 


5,48 












1994-m 


36196 


0,358 


0,398 


0,837 


9,23 












1995-m 


36195 


1,60 


0,375 


0,928 


5,37 












1995-b 


36197 


1,72 


0,398 


1,35 


5,54 












1999-m 


36209 


0,146 


0,392 


1,15 


7,50 


62005 


0,031 


0,386 


1,01 


6,10 


2000-b 


36212 


-0,626 


0,377 


0,858 


8,27 


62267 


-0,729 


0,374 


0,681 


6,63 


2002-m 


36217 


1,24 


0,347 


1,25 


9,46 


62356 


1,11 


0,369 


0,856 


6,73 


2002-b 


36217 


1,67 


0,367 


1,26 


6,40 


62358 


1,56 


0,379 


0,861 


5,25 


2004-m 


36221 


-0,095 


0,366 


1,45 


9,82 


62775 


-0,182 


0,363 


1,03 


8,37 


2005-b 


36223 


1,13 


0,351 


1,58 


12,0 


62778 


1,01 


0,373 


0,805 


7,16 


2007-m 


36219 


1,98 


0,396 


1,06 


8,02 


63514 


1,88 


0,405 


0,718 


5,37 


2007-b 


36219 


1,99 


0,394 


1,22 


5,28 


63516 


1,88 


0,397 


0,883 


4,19 



TAB. 7 - Moyennes (moy), écarts- types (éc-typ), skewness (skew) et kurtosis (kurt) des taux 
de participation r sur l'ensemble des communes (com.) et si possible sur l'ensemble des bureaux 
de vote (bur.). 



à ce stade, du « modèle zéro » aux données réelles. Noter au passage le meilleur accord 
du « modèle zéro » avec les taux de participation réels, comparés aux résultats électoraux 
réels (cf. Figs. [2] et E>. 

Par contre, la nouveauté —en terme de régularité— apportée par l'étude des taux de 
participation concerne leur décroissance en fonction de la taille de la population. Les ins- 
crits participent plus, en moyenne, et de façon récurrente, aux élections dans les communes 
à faible population, que dans celles à forte population (cf. Fig lA-13]) . 

Comment comprendre ce nouveau point ? La première façon consiste à invoquer des 
raisons d'ordre politique, sociologique, ou comportementale, pour expliquer pourquoi, les 
électeurs participent en moyenne plus aux élections dans les plus petites communes que 
dans les plus grandes villes —pour un aperçu d'une investigation de nature sociologico- 
politique du taux d'abstention en France, voir [5T] . (Nous pouvons évoquer dans les com- 
munes faiblement peuplées, une plus grande capacité de la mairie à mobiliser l'éiectorat, 
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FlG. 9 - Écart-type des taux de participation t en fonction du nombre d'inscrits ^insci 

cal- 
culé avec 36 intervalles ; pour les communes à gauche et pour les bureaux de votes à droite. Le 
« modèle zéro » (voir section [2.1,3p et les tirages binomiaux uniformes (voir section [2.1.2p s'effec- 
tuent à partir des valeurs réelles de l'élection 2007-b. La valeur moyenne Ni nsc de l'échantillon 
des communes de plus grande taille doit se considérer avec précaution puisqu'interviennent des 
valeurs extrêmes. 



une plus grande proportion de personnes âgées —qui votent plus en moyenne—, une 
élection vue comme une incitation à se rencontrer, etc. 0) La deuxième façon nous pousse 
à suspecter les données traitées. Le nombre d'électeurs inscrits sur les listes électorales, 
ne capture pas parfaitement le nombre d'électeurs qui vivent dans la commune. Pourquoi 
ne pas émettre l'hypothèse que ce biais dépend de la taille de la commune? Usant de 
Vépochê chère aux Sceptiques grecs, nous accepterons telle quelle la décroissance du taux 
de participation avec l'augmentation de la taille de la population des communes. De plus, 
nous acceptons tout au long de ce travail que le nombre d'inscrits sur les listes électorales 
reflète fidèlement la population de la commune (ou du bureau de vote) —comme nous 
l'avions fait au chapitre précédent, sans l'avoir précisé. 

2.2.2 Heurs et malheurs du « modèle zéro » 

Revenons au « modèle zéro » (cf. Eq.( H]) et section 12.1.31) qui, de par sa simplicité, 
pourra mettre en lumière certaines caractéristiques des données réelles. 

Fait encore notable ? l'amplitude du bruit a v = \J < rf > (qui provient de l'échantillon 
en Ni nsc minimisant l'écart-type en grandeur p des taux de participation) vaut a v ~ 
p . (1 — p) . A, avec A = (A[ T ]J min ~ 0, 2 pour les 12 élections analysées. (Cette valeur de 
A, qui minimise l'écart-type des r à l'intérieur d'un échantillon e en N insc , se retrouve 
directement à la figure [HJ et dans les échantillons à forte population.) 

Les histogrammes de la figure [TUI-a représentent la distribution sur l'ensemble des com- 
munes des r a obtenus à partir de ce modèle simpliste —dont les paramètres s'ajustent 
aux taux de participation réels de chacune des 12 élections analysées. Nous y distinguons 
une apparente similarité de ces 12 distributions entre elles, ainsi qu'une permanente dis- 
symétrie (skewness). Vu le caractère rudimentaire du modèle, la dissymétrie des distribu- 
tions des r obtenus par ce modèle ne peut résulter que de la décroissance moyenne du 
taux de participation en fonction de la population de la commune, et ce pour chacune 

6 Je remercie une nouvelle fois Brigitte Hazart, pour m'avoir indiqué toutes ces raisons, ainsi que la 
référence [5Tj . 
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"modèle zéro" "modèle zéro" 




FlG. 10 — « Modèle zéro » (cf. Eq. des taux de participation par commune. A gauche, 
histogrammes des r, et à droite, corrélation spatiale des r. 

des élections (voir Fig. IA-13]) . (De façon légèrement plus quantitative, les écarts- types et 
les skewness dérivés du « modèle zéro » se trouvent respectivement environ (13 ± 6)% et 
(23 ± 15)% inférieurs à ceux provenant des valeurs réelles.) Ainsi, la diminution perma- 
nente du taux de participation en fonction de la population de la commune implique, en 
partie du moins, la skewness permanente constatée sur les valeurs réelles (voir Fig. M et 
Tab.ED. 

Notons enfin des valeurs non négligeables de la corrélation spatiale C (R) des r a obtenus 
à partir du « modèle zéro » (voir Fig. [TUl-b) pour les taux de participation des 4 élections, 
1994-m, 1999-m, 2000-b et 2004-m. Noter que ces quatre élections ont la particularité 
d'avoir la plus forte variation des r en fonction de la taille de la population des communes 
(voir Fig. IA-131) . Obtenir de la sorte des corrélations spatiales convenables au regard des 
corrélations réelles —sensiblement de même portée, de forme quasi-logarithmique et de 
valeurs acceptables entre proches voisins— nous semble particulièrement remarquable, et 
appelle à commentaires. 

Les corrélations spatiales, qui témoignent usuellement de l'existence d'interactions lo- 
cales à l'échelle microscopique (des agents, ici), peuvent aussi se concevoir différemment. 
Les corrélations spatiales peuvent aussi résulter d'un même comportement moyen des 
agents, en fonction des caractéristiques mesurables des communes dans lesquelles ils 
résident. Le « modèle zéro » montre en effet par son aspect rudimentaire, qu'une simple 
dépendance du taux de participation en fonction de la population de la commune peut 
entraîner des corrélations spatiales assez acceptables. 

En résumé, le caractère simpliste du « modèle zéro » permet de mettre en évidence les 
deux points suivants : 

- la dissymétrie permanente de la distribution des taux de participation r sur l'en- 
semble des communes semble dériver de la variation du taux de participation en 
fonction de la population de la commune ; 

- la corrélation spatiale, qui traduit généralement la présence d'interactions locales à 
l'échelle microscopique (ici, à l'échelle des agents), peut aussi se comprendre comme 
un comportement commun, en moyenne, des agents qui résident dans des com- 
munes de mêmes caractéristiques (en l'occurrence ici, la taille en population de la 
commune). 
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FlG. 11 - Corrélation spatiale des taux de participation r des communes à gauche et des bureaux 
de vote à droite, où R a /3 = -jf e]2n;2(n + 1)]. La distance départementale caractéristique D 
(environ 2, 7 km) pour les communes s'applique également à celle des bureaux de vote. 



2.2.3 Corrélations spatiales 

Les figures [TT] tracent les corrélations spatiales, C(R), des taux de participation par 
commune et par bureau de vote. Les corrélations spatiales entre communes possèdent 
une décroissance à longue portée (environ égale à 80 R, soit environ 200 km) et une 
forme quasi- logarithmique, comme celles calculées à partir des résultats des élections (voir 
Fig.E]). 

Par contre, les corrélations entre proches communes des résultats électoraux dépassent 
(sauf pour l'élection de 2000) celles des taux de participation. Noter aussi que les trois plus 
fortes valeurs des corrélations entre proches communes —qui se détachent relativement 
par rapport aux autres élections— concernent trois des quatre élections qui procurent au 
« modèle zéro » les plus fortes corrélations, à savoir les trois élections européennes. 

2.2.4 Effets de l'environnement 

L'effet des taux d'abstention de l'environnement Vf 6 d'une commune centrale a —défini 
de nouveau par les n p = 16 plus proches communes de a- sur le taux d'abstention de la 
commune centrale se voit aux figures [T2"l Ces figures cherchent, comme à la section [2.1.61 
à déceler la connexion entre le taux de participation r a d'une commune centrale a et les 
taux de participation de son environnement —mesurés par Tq et cXq (cf. Eqs. (El El)). Ces 
figures ressortent les deux mêmes régularités que celles relatives aux résultats (comparer 
aux figures H]) : la commune centrale se comporte en moyenne comme son environnement 
(r a ~ Tq), et l'écart entre ces deux valeurs, \r a — Tq\, se relie fortement et en moyenne 
à la dispersion <Tq des r des communes dans l'environnement de la commune centrale. 
(Les normalisations effectuées dans ces deux figures (cf. section 12 . 1.61) accentuent leur 
ressemblance.) 

En revanche, toutes les courbes de Fig.[T2l-d montrent une croissance de r a en fonction 
de <7q ; ce qui s'accorde avec la décroissance de r a en fonction de la taille de la population, 
jointe à diminution de <Tq en fonction de la taille de la population (voir discussion similaire 
pour les résultats à la section [2.1. 10[) . 

Les figures IA-141 en annexe tracent les corrélations spatiales des t$ et des Uq , calculés 
à partir des taux de participation par commune pour chaque élection. En outre, les fi- 
gures EU] reportent, en fonction de leur classement, les positions géographiques des <Tq 
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FlG. 12 — Effet de l'environnement sur le taux de participation de la commune centrale. En 
trait magenta continu, les taux de participation de l'élection 2007-b mélangés aléatoirement ; et 
en trait bordeaux continu, le « modèle zéro » appliqué au données de l'élection 2007-b. Cette 
légende vaudra pour les figures IA-161 et IA-171 en annexe. 



de l'élection 2007-b des taux de participation par commune et par bureau de vote. Enfin, 
Fig. IA-71 et Fig. IA-81 représentent respectivement les histogrammes de Tq, de <Tq et de 
(r Q — Tq), ainsi qu'une connexion entre les deux grandeurs caractérisant l'environnement, 



2.2.5 Corrélations temporelles 

La table [8] relate les corrélations temporelles, C ti)t . (cr ), des o"q des taux de participa- 
tion entre des élections différentes. Les valeurs obtenues, et plus précisément leur moyenne 
Ct(co) et leur dispersion standard A[c t (a )] sur l'ensemble des couples d'élections, se rap- 
prochent énormément de celles obtenues à partir des résultats (cf. Tab. [3]). 

En revanche, les corrélations temporelles des taux de participation r a , ou des Tq, ex- 
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FlG. 13 — Moyenne des corrélations temporelles C% sur l'ensemble des couples d'élections, avec 
leur déviation standard A\c t ] en barre d'erreur, évalués pour r a , Tq et Uq des taux de parti- 
cipation. La figure de droite visualise leur rapport, if * ] , une sorte de rapport bruit/signal. Le 
nombre de communes, n p , intervenant dans les grandeurs Tq et (Jq (voir Eqs. (0 [7])), égal à 
16 jusqu'alors varie ici de 4 à 128. Les valeurs correspondantes à r se situent, par extension, à 
n„ = 1. 



hibent de bien plus grandes et régulières valeurs au regard de leurs homologues provenant 
des résultats (voir les tables IA-51 et IA-61 comparées aux tables IA-21 et IA-3[) . Les valeurs 
de C ti)t .(T ) pour n p = 16 communes dépassent même, en moyenne, celles de C^j (cr )- 
Ceci peut s'expliquer par le fait que les taux de participation des différentes élections, à 
l'encontre des résultats des élections, répondent à la même question (s'abstenir ou non) 
—même si les enjeux différent d'une élection à l'autre. La plus grande homogénéité du 
choix mesuré (participer ou non à l'élection) permet en effet de donner plus de sens à la 
comparaison possible des r", d'une même commune a à différentes élections (voir à ce 
sujet la discussion à la section 12.1.131) . 

Enfin, la figure fTBI (comme sa consœur, Fig.EJ relative aux résultats électoraux) reporte 
les moyennes C t et les écarts-types A[cy pour les <Tq , Tq et r Q , ainsi que l'influence du 
nombre n p de communes prises en compte. 
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0,595 
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0,509 
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0,607 
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0,554 
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1995-b 








0,605 


0,547 


0,537 


0,554 


0,556 


0,524 


0,500 


0,536 


1999-m 










0,697 


0,589 


0,570 


0,700 


0,592 


0,510 


0,551 


2000-b 












0,552 


0,546 


0,662 


0,542 


0,485 


0,532 


2002-m 














0,694 


0,581 


0,557 


0,499 


0,535 


2002-b 
















0,566 


0,572 


0,530 


0,574 


2004-m 


















0,642 


0,535 


0,575 


2005-b 




















0,567 


0,600 


2007-m 






















0,704 



TAB. 8 - Taux de participation : corrélation temporelle Ct u tj{^o) des <Tq sur chaque couple 
d'élections (ti,tj). Moyenne Ct((To) = 0,567; écart-type ArQ t r ao \] = 0,058; 



-Mft(go)] 

Ct(<T ) 



0,103. 
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FlG. 14 - Moyenne des (Jq en fonction de N^ l8C cour , calculé avec 36 intervalles. <Tq s'évalue à 
partir des taux de participation par commune, à gauche, et par bureau de vote, à droite. Les 
tirages aléatoires binomiaux, le « modèle zéro »et le mélange aléatoire des taux de participation 
s'effectuent à partir des valeurs réelles de l'élection 2007-b. 



1 1 




1 




mélange 

binomial 

modèle zéro 














1 








FlG. 15 - Moyenne des <7q des taux de participation en fonction de vr" resc calculé avec 36 
intervalles, évalués conjointement par commune à gauche, et par bureau de vote à droite. Les 
tirages aléatoires binomiaux, le « modèle zéro » et le mélange aléatoire des taux de participation 
s'effectuent à partir des valeurs réelles de l'élection 2007-b. 



2.2.6 ctq à la croisée des grandeurs 

En se référant à la démarche suivie au chapitre précédent (cf section 12.1.91) . les fi- 
gures HH tracent (7q des taux de participation en fonction du nombre d'inscrits N" nsc COUT = 

J2f3ev™ G Ni nsc - H s'en déduit les mêmes conclusions que pour les résultats électoraux (voir 
FiglU] et la discussion afférente), à savoir une forte connexion de (Jq avec la taille de la 
population. Cette forte connexion explique, comme nous l'avions déjà évoqué à la sec- 
tion EHUfll les diverses régularités associées à (Tq. 

Comme au chapitre précédent (cf. section 12.1.111) . la connexion de <Jq avec la taille de 
la population s'établit plus clairement avec la grandeur itf nsc (donnée à l'équation ffTUj) ). 
et procure de plus, une vision plus intime du rôle tenu par le bruit statistique dû aux tailles 
finies des communes (ou des bureaux de vote). Les figures [TBI tracent directement Uq en 
fonction de vr^ sc , tandis que la table M fournit les corrélations entre <Tq et 7r^ sc . Nous 
pouvons les comparer à leurs homologues relatives aux résultats électoraux (cf. Fig. [7J et 
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Tab. [5]) et constater, notamment, les mêmes régularités précédemment discutées. 





92-b 


94-m 


95-m 


95-b 


99-m 


00-b 


02-m 


02-b 


04-m 


05-b 


07-m 


07-b 


com. 
bur. 


0,636 


0,633 


0,665 


0,662 


0,661 
0,640 


0,677 
0,664 


0,615 
0,563 


0,635 
0,586 


0,679 
0,656 


0,609 
0,555 


0,610 
0,558 


0,663 
0,628 



TAB. 9 — Corrélations Cxy pour chaque élection sur l'ensemble des communes entre la dispersion 
des taux de participation X a = Uq et Y a = ~nf nsc - Cg et nf nsc se calculent, soit à partir des 
valeurs par commune (com.), soit à partir des valeurs par bureaux de vote (bur.). Sur l'ensemble 
des élections, pour les données par commune, Cxy = 0, 645 ± 0, 026 (et, Cxy = 0, 823 ± 0, 013 
avec un tirage binomial) ; et pour les données par bureau de vote, Cxy = 0, 606 ± 0, 046 (et, 
Cxy = 0, 832 ± 0, 008 avec un tirage binomial). 

2.2.7 L'ivresse de la séparation 

L'annexe O essaie, par plusieurs méthodes, d'extirper de Uq une part d'information 
locale dite positive. Par comparaison avec l'information locale positive contenue dans les 
Uq issus des résultats électoraux, il ressort les deux points suivants : 

- les <7q des taux de participation, dénués du bruit statistique dû aux tailles finies, 
ont un aspect permanent plus marqué que ceux des résultats électoraux (parce que, 
probablement, les taux de participation à différentes élections demandent des choix 
à faire aux électeurs, plus homogènes que ceux relatifs à l'expression d'un vote) ; 

- l'état des corrélations inter-communales, qui permet de comprendre d'une certaine 
façon l'information locale dite positive, montre un plus fort degré de corrélation 
pour les résultats électoraux, comparé aux taux d'abstention (en accord avec les 
corrélations des r entre communes voisines, plus fortes avec les résultats électoraux 
qu'avec les taux de participation). 

2.2.8 Récapitulatif 

L'étude portant sur les taux de participation de douze élections nationales confirme 
donc l'ensemble des conclusions tirées de l'analyse des résultats électoraux (voir sec- 
tion [2TTTT3]), à savoir : 

- La grandeur r convient à une étude portant sur la recherche des régularités. 

- Les corrélations des r a par commune montrent une décroissance à longue portée, de 
forme quasi-logarithmique (avec une valeur à courte distance relativement impor- 
tante pour les résultats électoraux, et plus faible pour les taux de participation) ; 

- Une commune centrale a se comporte en moyenne comme son entourage (r a ~ Tq), 
et l'écart à son entourage, \r a —Tq\, augmente régulièrement avec la dispersion, <Tq, 
de son voisinage. 

- <7q présente une forte permanence temporelle ; 

- o"q se relie fortement à la taille de la population, expliquant par là même les diverses 
régularités qu'il engage ; 

- (Tq traduit une part de bruit dû aux tailles finies des communes ou des bureaux de 
vote, mais aussi une information à caractère positif sur la zone où il s'évalue. 

L'étude des taux de participation a, en outre, mis en exergue l'importance de pouvoir 
comparer des choix similaires (ici, participer ou s'abstenir à une élection) sur différentes 
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élections. Les r a ou t§ des taux de participation montrent alors une forte stabilité tem- 
porelle, et bien plus grande que celles correspondantes aux résultats électoraux. 

En revanche, les taux de participation montrent une moins forte corrélation entre 
communes voisines, que celle des résultats électoraux (élection de 2000, mise à part). 

Signalons enfin que l'annexe [D] étudie l'indépendance des taux de participation des 
bureaux de vote au sein d'une même ville, ou dans les zones urbaines, et montre —en accord 
avec ce qui précède— leur moins forte corrélation par rapport aux résultats électoraux. 

Enfin, terminons cette partie en rappelant la similarité sur toutes les élections des 
distributions de probabilité (r a — (r)) (cf. les histogrammes de Fig. El des r a de toutes 
les communes ou de tous les bureaux vote, centrés sur leur moyenne) ; avec une asymétrie 
en partie expliquée par la diminution du taux de participation avec l'augmentation du 
nombre d'habitants des communes. 

Il s'impose à présent d'élargir cette étude au risque de la prédiction, ainsi qu'au jeu 
de la signification. 
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2.3 Prédictions et Discussion 



2.3.1 Prédictions 

Certaines régularités observées sur les résultats et sur les taux de participation des 
élections étudiées ne peuvent que nous inciter à nous risquer au jeu de la prédiction. Mais 
auparavant, précisons que les prédictions qui suivront ne se fondent que sur des régularités 
de certains phénomènes, et non pas sur leur connaissance intime, et encore moins sur une 
théorie qui les sous-tend. Après avoir observé comment une vingtaine de pierres tombent, 
un esprit naïf ne se laisserait-il pas porter à prévoir la manière dont la prochaine tombera 
à son tour ? 

Bien entendu, ces prédictions s'appliquent sur des élections comparable^, i.e. sur 
des élections portant sur un même choix à l'échelle de la France, et binaire en ce qui 
concerne leurs résultats électoraux. Les prédictions portent sur des grandeurs quantita- 
tives et régulières. Et nous outrepassons l'aspect critiquable et ridicule de tenir compte 
d'échantillons aussi restreints en taille (i.e. des ensembles de valeurs construits sur 6 
résultats électoraux et 12 taux de participation). Noter au passage que les grandeurs sur 
lesquelles portent les prédictions ne semblent pas montrer de variation, ou de dérive, glo- 
bale au cours du temps étudié (de 1992 à 2007). Enfin, les prédictions qui suivront se 
feront sur une barre d'erreur arbitraire de 2 sigma, où sigma dénote la déviation standard 
mesurée sur les données correspondantes. 

1. Écart-type en grandeur r (voir Eq. (j2J)) sur l'ensemble des communes. 
D'après les tables [5] et [7| : 



Ah 


mesures 


attendu 


résultats 
taux de participation 


0,487 ±0,035 
0,376 ±0,019 


[0,417; 0,557] 
[0,338; 0,414] 



2. Corrélations C tii tj(c"o) sur l'ensemble des communes des erg , à différentes élections. 
cXq se calcule à partir des valeurs par commune (voir Eqs. (J7|)). Bien entendu, la 
valeur attendue porte sur la moyenne des C ti!tj (a ) (cf. Eq. |SJ) entre les élections 
passées, U, et l'élection à venir, tj. D'après les tables [3] et El : 





mesures 


attendu 


résultats 
taux de participation 


0,579 ±0,060 
0,567 ±0,058 


[0,459; 0,699] 
[0,451; 0,683] 



3. Corrélation entre ctq e ^ ^umc o sur l'ensemble des communes. 

o"o et n Tnsc o se calculent encore ici à partir des valeurs par commune (voir Eqs. (JTl ITOl ). 
D'après les tables [5] et M '■ 

7 Un merci à Laurent Barry, auteur du remarquable essai, La parenté, qui m'avait conseillé de ne pas 
se cantonner à la prochaine élection, les européennes de 2009 au moment de la discussion, et ce pour 
mieux tester la pertinence de la démarche suivie. 
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c 

TTinsc, 


mesures 


attendu 


résultats 
taux de participation 


0,685 ±0,069 
0,645 ±0,026 


[0, 547; 0, 823] 
[0, 593; 0, 697] 



Un désaccord entre les valeurs à venir et celles prédites ci-dessus s'interpréterait, soit 
comme une mauvaise investigation de notre part, soit comme le signe d'une plus grande 
richesse, i.e. d'une manifestation d'un phénomène nouveau ou plus intense —à l'aune des 
élections analysées dans ce travail. 

2.3.2 Addenda : résultats des prédictions des européennes de 2009 

Bien avant le 7 juin 2009, date de l'élection des européennes en France, j'avais orienté 
ce travail d'étude des données électorales en vue de lui faire fournir des prédictions. A 
vrai dire, je pensais que ce travail de thèse aurait abouti plus tôt (j'avais déjà terminé en 
février 2009, aux annexes près, la rédaction de Enquête : des généralités aux prédictions). 
Le jour des élections approchant, et n'ayant toujours pas mené à terme la partie théorique, 
j'ai voulu officialiser FT3f en mai les prédictions précédemment établies. 

Tout ça pour dire que les prédictions faites sur les taux de participation des élections 
européennes de 2009 n'ont pas changé ma façon de poser le problème, et que je n'ai pas 
bâti cette rédaction sur des prédictions vérifiées a posteriori. 

Nous donnons maintenant les résultats des prédictions, tels qu 'ils apparaissent dans [T$ . 
1. Standard déviation of T a 





Previous measures 


Expected measure 


Real value 


Standard déviation of r a 


0.376 ±0.019 


[0.338; 0.414] 


0.360 



2. Corrélation of a% at différent élections 





Previous measures 


Expected measure 


Real measure 




0.567 ± 0.058 


[0.451; 0.683] 


0.577 



(Tab. [T] gives the twelve Ct^fVo), where t{ is one of the past twelve élections and, tj, the 2009 
European Parliament élection.) 



3. Corrélation between <7n and ir- 





Previous measures 


Expected measure 


Real measure 


Corrélation between Uq and 7r^ sc 


0.645 ± 0.026 


[0.593; 0.697] 


0.657 



92-b 


94-m 


95-m 


95-b 


99-m 


00-b 


02-m 


02-b 


04-m 


05-b 


07-m 


07-b 


0.534 


0.585 


0.533 


0.529 


0.648 


0.622 


0.539 


0.537 


0.679 


0.596 


0.532 


0.589 



TAB. 1 - Ct it tj(&o), where U is one of the previous twelve élections and tj, the 2009 European 
Parliament élection. The mean value is 0.577. 
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2.3.3 Discussion 



Tout ça pour ça? Tout ce travail d'enquête pour en arriver à déceler de bien piètres 
régularités. Qui, de plus pour celles qui engagent <Tq , doivent leur régularité à la présence 
d'un bruit statistique dû aux tailles finies. 

Devrions-nous nous consoler en arguant de la possibilité d'émettre les trois maigres 
prédictions^] ci-dessus ? Devrions-nous en arriver à implorer la mansuétude des bons connais- 
seurs de la chose publique, labile par essence ? Devrions-nous nous justifier et quémander 
des circonstances atténuantes, pour avoir vu l'importance de <Tq et y mesurer une in- 
formation locale positive, auprès des amateurs et interprétateurs de la glose publique, 
inépuisable à leurs sens? Devrions-nous pour autant contenter les grands penseurs opi- 
nant que, de toute façon, la chose publique échappe par essence à la science ? 

Non! 

Non, et de façon peu surprenante pour plusieurs raisons. Pour plusieurs raisons qui 
relèvent de certains aspects de la démarche scientifique. 

Première raison : pousser au bout autant qu'il se peut une investigation, et ce sans 
se poser la question dans un premier temps ni de son utilité, ni de sa bonne moralité. 
Ce travail a en effet mis l'accent sur des questions dites simples, plutôt que sur celles 
qualifiées d'intéressantes, i.e. qui généralement stimulent de prime abord la curiosité de 
l'honnête homme. (Remarque : nous ne parlons ici que d'accent, d'inclination, de notre 
démarche, puisque de manière générale, l'aspect dit simple d'une question n'exclut pas 
forcément son aspect dit intéressant, et inversement.) 

Deuxième raison : parvenir à étudier un phénomène en éliminant autant qu'il se peut 
les « détails » à l'échelle du phénomène mesuré. Ceci s'insère dans la dynamique à réduire 
l'information que pratique la science [79J. Probablement, avons-nous pu réussir notre 
challenge —observer des régularités—, justement parce que nous avons délaissé au préalable 
pléthore de particularités, de données sociologiques, politiques, historiques, et n'avons 
guère usé d'interprétation. Par contre, nous ne prétendons pas l'inexistence d'autres grilles 
d'investigation [7B]. De plus, la prise en compte d'autres données pourrait rendre caduque 
certaines parties de ce travail —comme la prise en compte des coordonnées spatiales 
des communes, permettant le calcul des corrélations spatiales, avait entraîné le rejet du 
« modèle zéro ». 

La troisième raison fait intervenir le jeu entre régularité et hors régularité, qui anime 
l'élaboration scientifique des connaissances [H] EZj- Ici, ce jeu donne de la signification 
aux choses, après les avoir dépouillé de leur apparente irrégularité. Dit autrement, une 
fois cerné le champ des phénomènes réguliers, ceux qui s'en échappent portent du sens, 
de l'information. Dit encore autrement : par-delà les régularités, pointe le sens. 

Je reprends l'exemple de l'esprit naïf qui regarde tomber des pierres. (Je vous le 
concède, en terme poétique on peut mieux faire.) Si cet esprit naïf se dote d'une démarche 
scientifique, à moins que la démarche scientifique ne l'ait déjà pourvu d'un esprit naïf, non 
seulement il croira que les prochaines pierres à leur tour tomberont, mais entreprendra des 
mesures. Mieux, il cherchera à voir dans ces phénomènes le plus de régularités possible. 
Je ne parle pas ici de la possibilité de formuler une théorie sous-jacente, potentiellement 
bâtie sur les régularités observées. Fort donc des régularités observées, il saura si un objet 
a un comportement « normal » ou non. Il saura alors qu'un comportement qui échappe 
à la règle possède potentiellement une plus grande richesse que les autres. Mais plus im- 

8 Prédire n'est pas expliquer : un titre explicite d'un livre de René Thom, laissé en suspens ici. 
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portant encore, il s'attendra à ce que cet échappement à la règle lui permette d'accéder 
à l'existence d'autres propriétés. Par exemple, une feuille qui tombe l'informera de l'exis- 
tence de l'air, de la présence du vent, de l'importance de la la forme de la feuille, de sa 
masse volumique, de sa rigidité, etc. Mais cette richesse, ce dévoilement^? s'opère plus 
facilement une fois constaté, par contraste, l'apparente régularité des pierres qui tombent. 

Que dire alors sur les élections telles que nous les avons étudiées ? 

Quel enseignement tirer, notamment, d'une observation minutieuse des figures 121 HH et 
plus particulièrement encore, des figures El HH [7] et H5]? Une question de vocabulaire au 
préalable : les irrégularités se définissent en terme de différence par rapport aux autres 
élections de même type, puis, en l'absence de modèle de vote, par rapport aux tirages 
binomiaux. En outre, comme nous l'avions signalé plus haut, l'écart au bruit binomial se 
distingue plus aisément par l'analyse des données issues des bureaux de vote, plutôt que 
par celles collectées à l'échelle communale. Bref, que dire donc des irrégularités observées 
sur ces courbes? 

Premièrement, les irrégularités ne se manifestent pas pour les taux de participation, 
mais uniquement pour les résultats électoraux de certaines élections. Deuxièmement, si 
les régularités apparaissent pour certaines élections, elles ne se manifestent que dans les 
zones à forte population, i.e. à faible itf nsc . 

Encore reste-t-il à trouver un moyen autre que visuel pour déceler la présence des 
irrégularités, ou dit plus simplement, pour les quantifier. Il convient pour cela de se référer 
aux tables [5] et [H par bureau de vote si possible, et de comparer les valeurs obtenues, soit 
entre différentes élections, soit avec celles issues des tirages binomiaux. Il ressort que les 
résultats électoraux du référendum de 2005 se détachent, et de loin, des autres élection^. 

Que conclure donc? Au préalable, j'attribue aux irrégularités précédemment ren- 
contrées la manifestation dans le champ électoral de ce que j'appelle, faute de mieux, 
le « fait politique ». Que dire donc de l'ainsi dénommé « fait politique », tel qu'il s'ap- 
plique dans les élections étudiées ? 

La réponse tirée de cette étude, tient en deux points. Ledit « fait politique » ne se 
produit, potentiellement, que : 

- dans les zones à forte population ; 

- pour les résultats électoraux de certaines élections. 

En outre, avec les élections traitées ici, ce dénommé « fait politique » se déploie le plus 
ostensiblement dans l'expression des votes du référendum de 2005. 

Pourquoi ? Avec son corollaire : comment étudier le « fait politique » ? Comment pou- 
voir l'aborder après ce travail consacré aux régularités? Que cache-t-il? La physique 
statistique procure-t-elle une bonne grille d'investigation ? Que de questions qui méritent 
de s'y appesantir... mais pas ici. 



9 « Nature aime se cacher. » Héraclite. 

10 Merci à Philippe- Alexandre Pouille pour avoir attiré mon attention sur l'importance des irrégularités 
et sur la particularité du référendum de 2005 ; et aussi pour ses critiques pertinentes sur les questions 
idéologiques soulevées par cette étude, ainsi que sur le concept d'atome social. 
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3 D'un modèle l'autre 



Méfiez-vous des gens qui regardent le monde par un trou. 
D'après le Pantagruel de François Rabelais [SU] . 

Jusqu'ici"! nous nous sommes principalement préoccupés de la recherche des régularités. 
Nous nous sommes appesantis sur les régularités liées à <Tq , en essayant de comprendre 
leur origine ainsi que leur signification. En revanche, nous n'avons pas poussé plus loin 
l'analyse des régularités en rapport aux corrélations spatiales. Plus important encore, nous 
n'avons pas cherché à établir un modèle simpliste à l'échelle microscopique, i.e. à l'échelle 
des agents, dans lequel s'insèrent les régularités observées. La partie qui suit va tenter d'y 
remédier. 

3.1 Préambule 

La tâche qui dès lors nous incombe consiste, principalement, à vouloir « sauver les 
apparences >o à l'aide des modèles très simples, puis, subsidiairement, à vouloir se prêter 
au jeu de l'interprétation —i.e. à vouloir tirer quelque enseignement de la concordance ou 
non des modèles avec les phénomènes. 

Précisons la démarche que nous suivrons pour obtenir un modèle dit satisfaisant. 
Premièrement, nous nous efforcerons à la simplicité. (Un modèle, à nos yeux, doit faire 
ressortir les traits saillants, sous-jacents aux phénomènes étudiés, i.e. il doit permettre de 
retrouver les caractéristiques générales des données à partir d'un minimum d'ingrédients, 
qui deviennent par là même significatifs.) La modélisation se basera sur des prémisses 
plausibles et facilement formalisables. (Précisons que nous nous placerons au sein du 
même canevas conceptuel tout au long de cette section.) Ensuite, l'impérative remise en 
cause, l'irremplaçable confrontation aux données, permettra de retenir ou non les modèles 
obtenus. (La simplicité du modèle a le mérite de laisser transparaître son parti pris, les 
traits saillants qu'il engage, et qui auront les données réelles pour réponse.) Et nous nous 
arrêterons là : nous n'irons pas à décréter que les choses, les individus, se comportent 
réellement tels que le modèle l'édicté. Ce qui ne nous empêchera pas pour autant d'analyser 
le modèle de façon critique, puis de l'interpréter. 

Insistons de nouveau sur le fait que nous nous bornons dans cette thèse à vouloir sauver 
les phénomènes, et ce au travers d'une question simple que nous soumettons aux données. 
Nous ne prétendons pas qu'il existe un et un seul modèle qui satisfasse à la confrontation 
des données, et encore moins, une seule question à poser aux données. (Ce qui nous 
permettra de garder la même façon de formaliser les phénomènes sociaux tout au long de 
ce travail, sans pour autant nier l'existence d'autres approches conceptuelles.) Sur un plan 
personnel, je ne crois pas que la physique doive se borner à sauver les phénomènes, ou 
faire répondre les données à une question ponctuelle. La physique gagne, et de beaucoup, 
à poser des théories, i.e. des cadres conceptuels larges et cohérents qui décrivent —en l'état 
des connaissances— très acceptablement les phénomènes. Mais cela ne peut se produire 
qu'après un long travail expérimental— au sens large— et théorique. Et je ne crois pas que 
la physique sociale ait déjà atteint ces degrés de maturité. 

Bref, commençons par passer en revue les diverses observations à retrouver, puis ex- 
plicitons les bases sur lesquelles reposent les modèles que nous utiliserons. 

11 Toute la partie qui suit doit beaucoup à Jean-Philippe Bouchaud. 

12 Avec un clin d'œil au livre richement documenté de Pierre Duhem [21], et à ses réflexions iconoclastes. 
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3.1.1 Les phénomènes à sauver 

Il est important de remarquer que les régularités des corrélations spatiales concernent 
les données électorales (résultats et taux de participation) à l'échelle de la commune, et 
non pas à l'échelle des bureaux de vote (cf. Figs. I3let [TTT) . Nous nous concentrerons donc 
sur les résultats électoraux et sur les taux de participation par commune. 

Récapitulons les diverses mesures effectuées précédemment —concernant la distribu- 
tion des r a ainsi que la corrélation spatiale des résultats et des taux de participation des 
communes— qui doivent être retrouvées par les modèles. 

- La moyenne de r a en fonction de Tq (voir Figs. 0]-a et fT2l-a) se représente convena- 
blement bien par une droite de pente sensiblement égale à un. 

- Les corrélations spatiales sont à longues portées. La portée caractéristique vaut ap- 
proximativement 80R ~ 200 km pour toutes les élections —exceptées principalement 
les résultats de 2002-b et de 2007-b. 

- Les corrélations spatiales ont une décroissance en distance quasi-logarithmique (cf. 
Figs. M et ED. 

- La distribution des résultats ou des taux de participation est toujours unimodale 
(voir Figs. □ et ED. 

Insistons sur le fait que les régularités ci-dessus ne dépendent : 

- ni de la moyenne globale du résultat ou du taux de participation (la moyenne sur 
l'ensemble des communes s'étend en effet de < p a >~ 50% à environ 80% pour les 
résultats électoraux, et d'environ 35% à 87% pour les taux de participation, comme 
le montrent les tables IA-11 et IA-4|) ; 

- ni de la valeur de la corrélation entre proches communes (C(R ~ 1) s'étend ici 
d'environ 0, 16 à 0, 54, résultats électoraux et taux de participation confondus). 

Notons au passage que la forme des corrélations spatiales recèle plus d'information, 
i.e. est plus contraignante, que la moyenne des r a en fonction des t$. 

A cela se rajoutent d'autres phénomènes plus fins et d'autres régularités qui font 
intervenir des écarts-types des r a à l'échelle nationale, ou locale —i.e. sur l'environnement 
Vf 6 des n p = 16 plus proches communes d'une commune centrale. Ces régularités ont 
déjà été recensées à la section [2.3.11 consacrée aux prédictions. Rappelons les néanmoins 
succinctement : 

- l'écart-type des r a sur l'ensemble des communes vaut dans les alentours de 0, 49 
pour les résultats, et 0, 37 pour les taux de participation ; 

- la corrélations entre <Tq et itf nsc vaut dans les environs de 0, 66 pour les résultats 
et taux de participation confondus ; 

- la corrélation temporelle des <Tq entre différentes élections vaut approximativement 
0, 57, à la fois pour les résultats et les taux de participation. 

Présentons maintenant notre façon de poser le problème —et le parti pris qu'il engage— 
pour retrouver les phénomènes. 

3.1.2 Bagatelles pour un modèle 

C'est une chance de disposer de tant de données, de mesures nettes du choix effectué en 
un jour par une quarantaine de millions d'individus. Nous profiterons de cette opportunité 
pour nous poser une question centrale, simple, et tenterons d'exiger des données leur 
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verdict. 

Répétons de nouveau que nous ne pensons pas qu'il n'y ait qu'une seule grille d'in- 
vestigation possible, ni que la réponse des données puisse être exhaustive. Une question 
avalisée par les données laisserait la place à d'autres approches possibles, surtout au stade 
actuel de développement de la physique sociale. Une réponse négative, quant à elle, serait 
riche d'enseignement puisqu'elle permettrait de rejeter clairement la question posée. 

La question à poser dépend intrinsèquement des données. Or, les données électorales 
collectent en un jour les choix (du vote ou de la participation à l'élection) des électeurs 
d'une commune, voire d'un bureau de vote. D'autre part, nous n'utiliserons que les données 
électorales conjuguées à la localisation spatiale des communes, à l'exclusion de toutes 
autres données de nature économique, sociologique, etc. 

D'où le truisme suivant : la question posée ne peut avoir de réponse qu'à l'échelle 
collective, et ne concerne que les choix, ou les intentions de choix, des agents au jour 
de l'élection. Sont exclues de la sorte des questions d'ordre psychologique, sociologique, 
etc., i.e. des questions liées aux linéaments idéologiques de l'agent, ou aux facteurs socio- 
économiques, etc. qui conditionnent statistiquement le choix des agents. Sont aussi exclues 
des questions concernant le comportement d'un même électeur à différentes élections. Sont 
enfin exclues les questions liées au déroulement de la campagne électorale, et notamment 
la rétroaction probable des partis politiques sur la dénommée opinion publique. 

Parmi la multitude des questions possibles, la question que nous posons est la sui- 
vante : une interaction entre agents, basique et limitée au voisinage géographique, peut- 
elle expliquer les phénomènes ? Noter que la simplicité de l'interaction va de pair avec une 
interaction locale, i.e. cantonnée aux endroits où l'agent se situe. L'accent est donc porté 
ici non pas sur la forme potentiellement complexe de l'interaction, mais sur la possibilité 
d'une interaction simple —et donc locale— à rendre compte des phénomènes. 

L'interaction considérée ici —au regard du choix à prendre par les agents— est sans 
aucune particularité, et donc la plus simple possible. Autrement dit, elle est par hypothèse 
symétrique, sans hiérarchie, sans leader, etc., et ne dépend ni de l'état des agents, ni de 
leur passé, etc. Elle ne dépend que des agents qui peuvent se rencontrer physiquement. En 
l'absence de données relatives aux divers déplacements des agents, nous restreignons la 
probabilité de rencontre des agents à leur lieu de résidence —assimilés aux communes où 
ils sont inscrits sur les listes électorales. (Bien que l'interaction entre agents soit d'emblée 
restreinte au voisinage, nous tenterons néanmoins par la suite d'éprouver cet a priori.) 

Nous essaierons donc de savoir si un magma d'atomes sociaux, interagissant entre eux 
de façon simple, permet de retrouver les phénomènes précédemment mesurés ? Ou, pour 
employer un mot à la mode, les phénomènes électoraux émergent-ils d'une interaction 
basique entre agents voisins ? 

Remarquons au passage une autre approche possible entr'aperçue avec le « modèle 
zéro » (cf. Fig. [TUl-b). Une corrélation spatiale des résultats électoraux (ou des taux de 
participation) peut résulter non pas d'une interaction entre agents, mais d'un comporte- 
ment statistiquement similaire des agents qui habitent dans des communes ayant le même 
état, les mêmes conditions. (A la section 12.2.21 l'état d'une commune ne dépendait que 
de sa population.) 

Bref, ce qu'il importe maintenant, n'est pas tant de savoir si la question posée est 
crédible ou non, si elle correspond ou non à la bienséance idéologique ou intellectuelle du 
moment, mais plutôt de savoir ce qu'en disent les données. 

Pour répondre à cette question, nous ferons usage de modèles simplistes. Simplistes afin 
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que les traits saillants du modèle ne soient pas noyés dans un maelstrom de considérations 
parasites. Parasites au sens de la question posée. 

Bien entendu, un modèle simpliste à faible nombre de paramètres ne peut contenir 
toute la richesse, toutes les particularités historiques, etc., et à toutes les échelles d'observa- 
tion du système qu'il prétend décrire. Il doit par contre retrouver certaines grandeurs sty- 
lisées du système. En l'occurrence, il doit pouvoir retrouver les régularités précédemment 
mesurées, et à la bonne échelle d'observation, i.e. à l'échelle de la commune, ici. 

De plus, les modèles que nous utiliserons se doivent à la plausibilité. Autrement dit, 
ils doivent se fonder sur un mécanisme microscopique plausible et cohérent, au détriment 
d'arguments purement heuristiques déconnectés les uns des autres. 

Bref, comme de coutume en science, nous essaierons de retrouver les phénomènes ma- 
jeurs (les phénomènes à sauver de la section 13.1.11) en faisant fi des « détails » et en se 
basant sur une description microscopique qui se veut plausible et pertinente. 

Tout au long de cette étude, nous allons nous placer à l'intérieur d'un seul cadre 
conceptuel ouvrant droit à une modélisation possible des phénomènes sociaux. Voyons 
donc cette grille de travail permettant la formalisation des phénomènes sociaux. 

3.2 RFIM en physique sociale 

3.2.1 Précédentes utilisations 

Parmi la riche boîte à outils [THl EU HE E2] dont dispose la physique statistique 
pour conceptualiser les phénomènes sociaux —à laquelle il manque encore à mon goût 
de sérieuses confrontations avec les données, aussi imparfaites ou parcellaires soient- 
elles, mais des confrontations néanmoins nécessaires pour lui faire acquérir un caractère 
cumulatif—, nous utiliserons le modèle d'Ising en champ aléatoire à température nulle, plus 
connu sous son acronyme anglais RFIM (Random Field Ising Model) à T. (Tout au long 
de ce travail, le RFIM sera toujours considéré à température nulle, et ne le mentionnerons 
plus par la suite.) 

Initialement conçu pour résoudre les problèmes de type bruit de Barkhausen et autres 
phénomènes d'hystérésis et d'avalanches, le RFIM [731 EU [75] , dont les lois d'échelle restent 
valables assez loin du point critique, a été appliqué pour modéliser de façon théorique des 
phénomènes sociaux [213 E7J [2EJ E7J et d'interaction entre acheteurs et vendeurs [3J1 [53] . 
L'article [35] passe en revue les différentes propriétés engendrées par ce modèle dans 
le cadre des phénomènes socio-économiques. Caccioli et al. [UJ enrichissent un modèle 
d'Ising par la prise en compte d'un effet de mémoire. Q. Michard et J.-Ph. Bouchaud [17] 
analysent trois types de données distinctes les unes des autres —l'augmentation de l'achat 
des téléphones portables en Europe, la diminution du taux de natalité en Europe et la 
fin des applaudissements en salles de spectacle— sous l'angle du RFIM, modèle qui inclut 
selon ses paramètres des discontinuités, l'arrêt brutal des applaudissements en l'occur- 
rence. L'article [H] s'appuie sur une belle étude expérimentale [69] du téléchargement des 
chansons en diverses situations, pour étendre le RFIM aux choix non binaires et pour 
calibrer ensuite de façon semi-quantitative les paramètres du modèle. 

Voyons sous quel angle, selon quels concepts, les modèles de type RFIM appréhendent 
les phénomènes sociaux. En d'autres termes, voyons succinctement les idées sous-jacentes 
aux phénomènes sociaux sur lesquelles reposent le RFIM. 
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3.2.2 Description des phénomènes sociaux par le RFIM 

Explicitons brièvement comment le RFIM aborde le choix binaire, Si ± 1, accompli 
par un agent i. Dans le cadre de cette étude, +1 représente, soit le vote en faveur du choix 
gagnant à l'échelle nationale (cf. chapitre 12.11) . soit la participation de l'agent à l'élection 
comme au chapitre 12.21 

Un choix résulte, selon ce modèle, de la superposition de trois composantes identi- 
fiables : l'agent isolé, l'influence « extérieure » et enfin, l'interaction entre agents. Détaillons- 
les succinctement. 

- L'idiosyncrasie, une propension individuelle de l'agent i par rapport au choix pro- 
posé. Elle se traduit en physique statistique non seulement par un unique scalaire h i: 
mais surtout par une variable aléatoire —à cause de la quantité a priori très grande 
des « choses » dont elle dépend. Cette variable aléatoire décrivant la tendance in- 
dividuelle de l'agent i, isolé de l'environnement et des autres agents au moment du 
choix à prendre, peut être alors considérée comme indépendante et identiquement 
distribuée (i.i.d.) sur l'ensemble des agents, et fixe au cours du temps analysé. 

Un champ global, affectant d'une égale façon l'ensemble des agents, représente l'in- 
fluence extérieure. Il est reporté par une grandeur réelle F. 

- L'influence des autres^], écrite comme une somme d'influence de chaque agent j 

sur l'agent i, soit "%; v ' --, 3 où Vi représente le voisinage de z, l'intensité de 

l'influence de j sur i et enfin Sj le choix de j. (Le dénominateur comptabilise le 
nombre d'agents dans le voisinage Vi avec lesquels interagit i.) Jij > pousse i à se 
conformer aux choix de j, et inversement, Jij < incite i à s'opposer aux choix de j. 
L'effet de la plus simple imitation, selon laquelle chaque agent tend à imiter tous les 
agents de son voisinage d'une égale façon, peut donc se formuler comme = J > 

pour tout i et j du même voisinage. En notant my. = ^ ev ' 3 , le choix moyen (la 

polarisation des spins en physique) dans le voisinage Vi, le terme d'imitation devient 
J.m Vi . 

Ainsi, selon le modèle à seuil qu'est le RFIM standard : 

Si = sign [ht + F + J . m Vi ] . (12) 
Dans le cas d'une imitation entre agents, l'intensité d'interaction, J, est positive. 

Il est à noter que l'unique hétérogénéité prise en compte par le modèle, réside dans le 
terme idiosyncratique, et encore, celle-ci dérive d'une variable aléatoire. Bien évidemment, 
cette description, ou cette formalisation, ne prend son sens qu'à l'échelle des phénomènes 
collectifs. Autrement dit, le RFIM tente de décrire les phénomènes collectifs, et non pas 
les linéaments d'ordre psychologique conduisant au choix effectué par l'agent le jour J. 
En conclusion, le RFIM aborde donc les phénomènes collectifs en mettant l'accent sur 
l'imitation simple des agents —au sein d'un environnement décrit par un champ global F. 

Cette modélisation, de type « agent-based model », illustre de façon générale l'approche 
de la physique statistique des phénomènes sociaux. Premièrement, la simplicité prédomine, 
et les « détails » microscopiques à l'échelle de la mesure sont expurgés —comme souvent en 
science. Deuxièmement, cette modélisation repose sur une décomposition, une séparation, 

13 « Je est un autre » de Rimbaud, certes, mais avec une toute autre conception. 
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une non intrication, à la fois des différentes tendances qui interviennent dans le choix de 
l'agent, et aussi du groupe de personnes pris comme un ensemble d'agents individuels : 
un ensemble d'atomes sociaux. 

Terminons enfin cette partie critique en mentionnant l'impossibilité —connue récemmen 
d'expliquer le noyau en terme d'interaction à deux corps (nucléons), ce qui conduit à in- 
troduire phénoméno logiquement, actuellement, une force à trois corps [561 154], 136]. 

Revenons maintenant au problème des résultats ou des taux de participations mesurés 
par commune, et voyons si un modèle issu du RF1M peut s'accorder avec les observations. 



3.3 RFIM avec imitation du choix des agents 

Commençons par passer en revue chaque terme de l'équation ( 1121) —relative au RFIM 
standard— au regard du problème concret qui se pose ici : la détermination du résultat 
ou du taux de participation par commune à une élection donnée. Ceci nous permettra, 
moyennant quelques hypothèses, d'écrire un modèle basé sur le RFIM standard. Nous 
confronterons ensuite le modèle obtenu aux données réelles provenant des résultats et des 
taux de participation. 



3.3.1 Du RFIM standard aux élections dans une commune : précision sur les 
termes employés 

La commune a contient iV a agents qui effectuent N a choix binaires Sf. Le choix binaire 
se réfère à voter en faveur de l'un des deux candidats en lice du second tour d'une élection 
présidentielle, ou à choisir entre un oui ou un non lors d'un référendum. Ce type de choix 
lié au résultat électoral de la commune a, implique N a = Nf xpr agents, i.e. un nombre 
Nf de bulletins exprimés. Sf = +1 si l'agent i de la commune a vote en faveur du choix 
qui se trouve gagnant à l'échelle nationale, ou —1 dans le cas contraire. L'autre type de 
choix envisagé ici, la participation à une élection, fait intervenir N a = Nf nsc agents inscrits 
sur les listes électorales de la commune a. Sf ne dépend plus de la convention précédente 
d'assigner la valeur +1 au choix gagnant à l'échelle nationale de l'élection considérée. Plus 
simplement, Sf — +1 si l'agent i de la commune a participe à une élection, et —1 s'il ne 
participe pas, quelque soit le taux de participation de l'élection à l'échelle nationale. 

La polarisation de la commune a, en terme de résultat (ou de taux de participation) 
à une élection donnée, s'écrit alors comme 

m a = 2p a - 1 = ^ i=1 i , (13) 
où Sf représente le choix afférent de l'agent numéro i de la commune a. 

En se basant sur l'Eq. (TT2l . il semble naturel d'appliquer à chaque commune a considérée 
non pas le même champ global F à l'ensemble des communes, mais un champ qui lui est 
propre, F a . Ensuite, F a peut se noter comme la somme d'un terme, f a , spécifique à la 
commune a, et d'un champ global F, appliqué à toutes les communes, soit F a = F + f a . 

Le terme spécifique f a peut se comprendre de deux façons différentes. La première 
façon, en accord avec la manière dont il a été introduit ci-dessus, lui donne la signification 
d'un champ appliqué qui se surajoute au champ global F. La seconde façon lui attribue 

1 Je remercie Frédéric Nowacki de me l'avoir signal, expliqué, réexpliqué, et donné ces références. 
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la signification d'une moyenne : la moyenne des idiosyncrasies de la commune a. En 
effet, ni hi seule, ni F seul, ne sont relevants dans Eq. (112p . mais leur somme (/ij + 
F) l'est. Prenons le cas d'un champ uniforme F appliqué à chaque commune. Pour un 
agent i d'une commune a, l'expression précédente, relevante, devient (hf + F), où hf 
dénote l'idiosyncrasie de cet agent. Selon cette écriture, la spécificité de la commune a est 
transcrite par les particularités de hf. En notant maintenant f a comme la moyenne des 
idiosyncrasies hf des agents de la commune a, i.e. hf — > hi + f a , l'expression relevante 
devient (hi + f a + F). Dans cette dernière équation, il importe de voir que hi représente 
une idiosyncrasie d'un agent i indépendante de la commune où il réside. La spécificité de 
la commune a est transcrite de nouveau par le terme f a , et l'agent i perd toute spécificité 
liée à la commune où il réside. 

Bref, nous avons opté, par pure convention, en faveur d'une idiosyncrasie des agents 
uniforme à l'échelle nationale, i.e. indépendante des lieux de résidence. Elle se note pour 
un agent i d'une commune a comme hi. La spécificité de la commune a est transcrite 
par f a que nous appelons, faute de mieux, tendance spécifique de la commune a. Cette 
tendance propre de la commune a peut ensuite être interprétée, soit comme un champ 
appliqué qui se surajoute au champ appliqué et global, F, soit comme la moyenne des 
idiosyncrasies des agents qui habitent la commune a. 

Voyons maintenant comment écrire le terme d'interaction entre agents. 

Il semble convenable que la probabilité de rencontre d'un agent avec un autre agent, 
augmente d'autant plus que la distance qui sépare leur lieu de résidence diminue. Dit 
autrement, la probabilité que deux agents entrent en relation diminue avec l'éloignement 
géographique des agents. (N'ayant aucune donnée sur les lieux de travail, de sortie, et 
autres déplacements des agents, la probabilité de rencontre des agents ne dépend ici 
que des lieux où ils résident —assimilés aux communes où ils sont inscrits sur les listes 
électorales.) En outre, nous pouvons faire l'hypothèse la plus simple possible liée à l'in- 
fluence potentielle entre deux agents : l'influence entre deux agents ne dépend que de leur 
rencontre, ou interaction. Nous écartons par là même des types de modèles dans lesquels 
la probabilité de s'accorder entre agents dépend de leur opinion préalable, et augmente 
d'autant plus que les opinions des deux agents sont proches, comme par exemple dans 
les modèles à opinion continue et confiance limitée (bounded confidence models) à la 
Deffuant-Weisbuch ou Hegselmann-Krause (voir [THIHS] pour une vue d'ensemble). Nous 
ne prétendons pas par là nier leur validité potentielle, mais nous adoptons l'hypothèse 
la plus simple possible quant à la manière dont deux agents s'influencent. (Il faudrait 
entreprendre un tout autre travail pour appliquer aux données électorales les idées qui 
président aux modèles de type d'opinion continue à confiance limitée. Mais rappelons que 
le but de cette thèse n'est pas d'affirmer que les « choses se passent comme ça », et donc, 
« pas autrement », mais de trouver un modèle plausible, et pas nécessairement le meilleur 
—terme flou—, qui puisse rendre compte des phénomènes.) Bref, nous convenons, d'une 
part qu'un agent puisse être influencé par un autre agent, du moment qu'ils se rencontrent, 
et d'autre part que la probabilité de rencontre décroît avec la distance géographique qui 
les sépare. Enfin, selon le RFIM standard, seul le choix (fait ou à faire) d'un agent peut 
influer sur un autre agent. 

Il paraît vraisemblable que la probabilité de rencontre entre un agent i, et un autre 
agent j décroisse exponentiellement en fonction de la distance qui les sépare, et avec une 
longueur caractéristique l c . Comme précédemment, le lieu de résidence d'un agent dans 
une commune est ramené à la position (les coordonnées XY) de sa mairie. La probabilité 
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de rencontre —et donc ici, d'interaction— d'un agent i dans une commune a avec un agent 
j dans une commune (3 distantes de r a/3 est alors proportionnelle à exp(— r -f^)- 

Ainsi, la somme des influences qu'un agent i d'une commune a reçoit des autres agents 
j s'écrit comme 



EgE£«xp(- ^) • si 
E/î Ef=iexp( 



(Nous négligerons les termes en 1/N a , i.e. la valeur du choix de l'agent i sur l'ensemble 
des N a choix de la commune.) 

L'équation ci-dessus prend une forme plus simple en notant pp-> a , le poids, ou la 
contribution, de l'influence globale de la commune (3 sur un agent i d'une commune a. 
Dit autrement, un agent i d'une commune a reçoit l'influence globale des agents d'une 
commune (3 avec un poids, ou une contribution, pp-* a - Ce poids, ou cette contribution, 
P/3-,a ne dépend ici que de la population de la commune (3 et de la distance relative r a p 
entre les deux communes, et s'écrit plus explicitement comme 



p^ a = N*. exp(—f) , (15) 

'c 

ce qui conduit à l'expression générale : 

m a = — ^ . (16) 

E/9 PP-+<* 

Nous aurions pu écrire directement m Va sans faire intervenir pp^a, mais comme nous 
le verrons ultérieurement, la forme de p/3-> a recèle d'une signification ouvrant droit aux 
interprétations. 

Dans cet ordre d'idée, il paraît assez acceptable qu'un agent i interagisse avec un 
nombre constant d'agents par commune, et donc indépendamment de la taille des com- 
munes —au coefficient d'atténuation près dû à l'éloignement, exp(— ^). Dans ce cas, 
Pp^a devient 

pp^a = exp( — p) , (17) 

à inclure ensuite dans l'équation f|T6l) conduisant à m Va . 

Chacun des termes qui intervient à l'intérieur d'une description basée sur le RFIM 
ayant été abordé, critiquons maintenant notre démarche. 



Il est important de comprendre notre parti pris et ce que nous voulons faire ressortir. 
Le modèle utilisé comporte comme paramètres clés, le coefficient d'imitation, J, et une 
longueur caractéristique de prise en compte du voisinage, l c . Les tendances spécifiques 
des communes f a sont non corrélées, ou mieux, i.i.d. pour l'ensemble des communes a, et 
les idiosyncrasies hi sont uniformément réparties à l'intérieur du territoire. Remarquons 
au passage le faible nombre d'ingrédients du modèle, ce qui permet de connaître facile- 
ment ses traits saillants. Nous voyons par là que ce modèle se propose de capturer des 
caractéristiques récurrentes des élections (voir section. 13. 1 . 1|) à partir d'une interaction 
microscopique locale : une simple imitation du choix des agents du voisinage. Autre- 
ment dit, ce modèle a pour objectif de faire ressortir certains phénomènes électoraux (les 
phénomènes à sauver) à partir d'une imitation basique du choix des agents situés dans 
leur voisinage. C'est peut-être une mauvaise façon d'aborder le problème des résultats 
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électoraux, mais au moins, cet angle d'attaque a le mérite d'être clairement posé, et 
mieux encore, il permet aux données d'y répondre —espérons-le— clairement. 

La question qui se pose à nous, n'est donc pas de savoir si ce modèle correspond à 
une bonne façon d'aborder le problème ou non, s'il est plus ou moins plausible, etc., mais 
plutôt, s'il convient, s'il répond aux données, autrement dit s'il réussit sa confrontation 
aux données. 

Après ce court —mais nécessaire— laïus, écrivons explicitement le modèle du RFIM 
appliqué aux élections par commune. 

3.3.2 Écriture du modèle 

Le choix Sf d'un agent i d'une commune a, de tendance propre f a , de voter en faveur 
de l'un des deux choix proposés (ou bien de participer ou non à l'élection) s'écrit alors 
comme 

S? = sign [hi + f a + F + J . m Va ] . (18) 

Soient respectivement p et V > , la densité de probabilité et la probabilité cumula- 
tive des idiosyncrasies individuelles hi — i.i.d. à l'échelle nationale selon la convention 
précédemment adoptée. ("P>[X] = V[hi > X] = p{h)Ah). Et en ne se préoccupant pas 
des tailles finies —question qui comme nous l'avons déjà évoqué affecte (Jq principalement—, 
le résultat d'une commune a, ou son taux de participation à une élection, devient selon 
le RFIM standard : 

m * = 2V > [-F - f a - J .m Va ]-l . (19) 

Voyons maintenant quelles distributions statistiques utiliser pour décrire les idiosyn- 
crasies hi et les tendances spécifiques communales f a . 

Les raisons de généralité et de simplicité vont guider une nouvelle fois notre choix. 
Sachant que la distribution gaussienne [21] est la distribution statistique la plus générale 
possible (obtenue avec le théorème centrale limite, sous des conditions peu restrictives) ou 
la plus simple possible (qui maximise son entropie ou information de Shannon à variance 
finie), nous l'adopterons pour décrire les distributions hi et F a . Dans ce cadre, F a = F+f a 
peut être vue comme une distribution gaussienne i.i.d. sur l'ensemble des communes a, 
de moyenne F et d'écart-type 07. Dit autrement, la distribution des f a qui relate les 
fluctuations des F a , est une gaussienne de moyenne nulle et d'écart-type 07. Quant à la 
distribution hi, i.i.d. sur l'ensemble des agents à l'échelle nationale, elle est de moyenne 
nulle comme nous l'avions précédemment discuté. L'écart-type cx^ des hi est prise comme 
étant égale à un. Dans l'équation (j!9p . J et F a interviennent de façon relevante dans leur 
rapport respectif à er^ (i.e. J/cr h et F a /ah), ce qui incite à opter pour ah = 1 et à ne 



plus l'écrire par la suite. (^ ► J, — > F et ^ —>■ 07.) L'équation (Îl9l) s'écrit alors en 



utilisant la fonction d'erreur complémentaire, erfc, comme : 

m a = erfc [ _ F + f a + J.m v « (2Q) 
V2 

Ce modèle comporte donc quatre paramètres. Le premier, J, relate l'intensité de l'imi- 
tation des choix entre agents. Le deuxième, F, relève du champ national appliqué à 
l'ensemble des agents de toutes les communes. Le troisième, 07, dénote l'intensité des 
fluctuations, des particularités, des communes a. Le quatrième, l c , traduit la longueur ca- 
ractéristique d'interaction entre agents des communes voisines. Notons que les conditions 
initiales peuvent jouer un rôle important lorsqu'il existe plusieurs équilibres possibles. Et 
bien entendu, l'analyse du modèle correspond aux solutions stationnaires qu'il procure. 
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3.3.3 Réfutation du modèle et question ouverte 

Le modèle RFIM écrit aux équations (ÎTÏÏj) ou (j2*Ul) possède une grave lacune : il ne 
s'accorde pas avec les données. En d'autres termes, les observations invalident ce modèle 
qui repose sur l'imitation du choix des agents. 

L'argumentation s'appuie sur les deux points suivants : les corrélations des r a des 
résultats (ou des taux d'abstention) sont à longue portée, et la distribution des r a sur 
l'ensemble des communes est toujours unimodale et non fortement étalée. Le premier point 
suggère que le système se trouve proche d'un point critique —ce qui n'est pas difficile à 
assurer en jouant sur la valeur de J. (Le point critique obtenu avec F a = F uniforme dans 
l'équation ( 1201) . se caractérise par J = \Zir/2 ~ 1, 25, F = 0, et une moyenne < m a >= 
sur l'ensemble des communes, soit < p a >= 0,5 et < r a >= 0.) A noter que la pente 
approximativement égale à un de la moyenne des r a en fonction de Tq conforte ce premier 
point. Le second point impose une distribution toujours unimodale, y compris pour une 
moyenne < p a >~ 0, 87 loin du point critique : c'est là que le bât blesse. L'annexe [Ë] 
établit plus scrupuleusement la réfutation de ce modèle en se servant du cas particulier 
< p a >~ 0, 8 rencontré dans les résultats de 2002-b et des taux de participation de plu- 
sieurs élections (voir Tabs. IA-11 et IA-4|) . Cette annexe montre l'incapacité du modèle à 



produire simultanément : des corrélations à longue portée des p a , une distribution des p a 
non bimodale (ni très étendue), et ce avec une moyenne d'ensemble proche p = 0, 8. 

Le principe de réfutabilité pouvant être considéré comme critère de scientificité par 
certains auteurs^, essayons d'aller plus loin dans notre démarche. Précisons que de notre 
côté, nous n'avons hélas pu réfuter une théorij^l. mais simplement un modèle. Un modèle 
fondé sur l'imitation du choix des agents. Ce qui pousse naturellement à se poser la 
question : quid de l'imitation du choix des agents dans n'importe quel modèle ? 

Mais auparavant donnons du corps à la réfutation du modèle écrit à l'équation ( |2Ô1) . 
Rappelons que l'argument principal se base sur un comportement similaire des données 
(entre tous les résultats électoraux, ou bien entre tous les taux de participation) quelle 
que soit la moyenne < p a > sur l'ensemble des communes. Ce qui rentre en contradiction 
avec la particularité, la singularité, imposée par le point critique du modèle. Avec < p a > 
loin du point critique, le modèle ne peut se comporter comme s'il était proche du point 
critique en < p a >= 0, 5. (Un point critique néanmoins nécessaire pour faire apparaître 
des corrélations à longues portées avec ce modèle.) 

Cette réfutation devient dès lors robuste à certaines modifications. Par exemple, chan- 
ger de distribution statistique des idiosyncrasies ne déplacerait que la valeur J du point 
critique. Que l'intensité de l'imitation J varie d'une commune à l'autre (i.e. J — > J a ) 
selon une gaussienne de moyenne J, n'altère pas non plus profondément les solutions 
obtenues avec un J unique. (Un changement majeur peut éventuellement se produire si, 
à l'instar des verres de spin, J a prend des valeurs négatives. Mais un tel modèle diffère 
alors du RFIM basé sur une interaction purement imitative.) De même, des simulations 
montrent que la fluctuation de l'un des différents paramètres autour de leur précédente 
valeur (F — > F(t), ou bien f a — > f a (t), ou bien J — » J(t)) ne modifie pas notablement 
les conclusions établies à l'annexe El 

Notons enfin que le champ appliqué, F, peut être assimilé à une imitation des agents à 



15 Avec Karl Popper comme chef de file de ce courant de pensée. 

16 L'auteur de cette thèse plaide son incapacité à pouvoir l'entreprendre, fortement aidé par sa 
méconnaissance de théorie quantifiable sur le sujet, s'il y en a. 
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l'échelle nationale, i.e. F = J . (m a ). Dans le même ordre d'idée, introduire une sorte de 
réseau pp^ a des imitations du choix des agents des communes (3 sur ceux des communes 
a, non circonscrit aux plus proches communes (comme dans Eqs. (iTïïl) . (ÎT7|) ). ne devrait 
pas non plus modifier substantiellement les solutions précédemment établies si le réseau 
est construit sur des critères généraux. Nous l'avons vérifié dans un cas particulier et 
« réaliste », issu du réseau de type « gravity model » observé empiriquement sur les pro- 
babilités de connexion et sur la durée des communications téléphoniques entre personnes 
de différentes communes belges [121 HO]- Dans ce cas, 



avec d = 2 pour le « gravity- model ». Une distance limite r c , i.e. un cutoff, doit intervenir 
ici, tel que p^ a = -^y si r a p < r c , et pp^ a donné par Eq. f[2"Tj) autrement. Nous avons 
choisi r c = 3 km qui correspond environ à la distance moyenne entre deux communes. 

Bien entendu, un réseau p^ a construit de façon ad hoc afin de contenir l'ensemble des 
corrélations —y compris à longues distances— entre différentes communes, ou l'existence 
« réelle » d'un tel réseau —que nous n'avons pas été en mesure de percevoir—, pour- 
rait permettre de retrouver les phénomènes à partir du RFIM avec imitation des choix. 
(Voir [22] pour une vue d'ensemble sur les modifications engendrées par un réseau sur un 
phénomène critique.) Mais dans ce cas, la principale information contenue dans le modèle 
proviendrait de la masse d'information contenue dans le réseau, et non plus seulement du 
couple de paramètres ( J, l c ) du modèle utilisé jusqu'alors, et circonscrit à l'influence du 
voisinage. Nous nous en tenons là, et préférons pour l'heure que le modèle utilisé pour 
reproduire les phénomènes contienne le moins d'ingrédients possible. Un modèle dans le- 
quel les corrélations observées à longue distance peuvent résulter des interactions locales 
à l'échelle microscopique, i.e. à l'échelle des agents. (Nous testerons par la suite la validité 
d'une influence restreinte au voisinage, et la comparerons avec celle décrite par Eq. l2~Tj) .) 
Nous restons par là même fidèle à l'objectif que nous nous sommes fixés : une interaction 
simple —et donc locale— peut-elle rendre compte des phénomènes ? 

Élargissons le débat. 

Nous venons de réfuter le RFIM basé sur l'imitation locale du choix des agents. (Ici, les 
choix sont binaires : voter en faveur de l'un des deux candidats en présence d'une élection 
présidentielle, apposer un un oui ou bien un non lors d'un référendum, et enfin participer 
ou s'abstenir à une élection.) Cette réfutation a été étendue à de légères variantes de ce 
modèle. Nous venons donc de montrer que, dans le cadre du RFIM, et pour les élections 
étudiées, les agents n'imitent pas le choix des autres agents de leur voisinage. Autrement 
dit, en suivant le RFIM et toujours pour les élections analysées, l'imitation d'un agent ne 
procède pas d'un décompte des deux choix possibles réalisés —ou ayant l'intention d'être 
réalisés— par les autres agents qu'il rencontre. Tout se passe comme si le nombre d'agents 
— stricto sensu— en faveur ou contre un choix possible n'a pas d'influence majeure 17 ! sur 
les choix réalisés. Plus explicitement et avec les précautions d'usage du « tout se passe 
comme si » : qu'il y ait dans l'entourage d'un agent, 50 et 50% d'agents en faveur des deux 
choix possibles, ou bien, par exemple, 80 et 20%, n'a pas, en tant que tel, d'importance 
sur son choix. 

17 Le modèle utilisé n'essaie de relater, sous forme mathématique et statistique, que les principaux traits 
stylisés possibles d'un agent. 
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Que l'étude des données électorales permette de tirer une telle conclusion constitue en 
soi un résultat fort. Mais, le caractère inopérant de l'imitation directe du choix des agents 
ne concerne bien entendu que les élections traitées ici, et surtout, se place dans le cadre 
interprétatif d'un modèld^l : le RFIM. Est-il maintenant possible de généraliser cette affir- 
mation à tout autre modèle ? En d'autres termes, existe-t-il un modèle qui puisse rendre 
compte des phénomènes électoraux ici mesurés, dans lequel l'interaction entre agents ne 
repose que sur l'imitation locale de leurs choix? Dit encore autrement, est-il possible qu'un 
modèle où les spins imitent les autres spins de leur entourage reproduise ces phénomènes 
électoraux? (L'interaction locale entre spins seraient alors de type ferromagnétique —pour 
restituer l'imitation—, et les spins ne pourraient prendre que les valeurs ±1, de manière 
à transcrire un choix +1 ou —1.) On peut penser aux « voter models », aux « majority 
rule models », aux modèles de percolation, aux modèles épidémiologiques, etc. (voir no- 
tamment [IH1 EU El E2] et leurs références). Par rapport aux élections étudiées ici, je ne 
le crois pas. Je ne le crois pas, et pour les mêmes raisons qui nous ont poussé à réfuter 
le RFIM : à cause de la particularité introduite par le point critique, en contradiction 
avec la régularité des phénomènes observés, indépendante de la moyenne nationale des 
résultats (ou des taux de participation). Je me hasarderai donc à croire cette affirmation 
quelque peu contre-intuitive : effectivement — i.e. pour n'importe quel modle— , tout se 
passe comme si les agents au cours de ces campagnes électorales ne sont pas directement 
influencés par la proportion des choix, ou des intentions de choix, des autres agents de 
leur voisinage. Mais par delà le simple fait peu scientifique d'y croire ou de ne pas y croire, 
la physique sociale gagnerait évidemment à ce qu'elle puisse affirmer une telle assertion. 

Ou la réfuter. 

3.4 Imiter autrement 

Si l'interaction directe entre agents via leur choix ne peut rendre compte des phénomènes 
observés, sous quelle autre forme l'influence existe-t-elle ? 

Comme nous l'avions annoncé au début de cette section, nous continuerons à adopter le 
même cadre conceptuel qui avait conduit au RFIM avec imitation des choix. Autrement 
dit, nous ne repartons pas de zéro dans la modélisation, mais nous voulons modifier 
l'équation f TT8î) de manière à la rendre compatible aux données. Modifier, et non pas 
complexifier en y incluant d'autres ingrédients, puisque nous voulons des modèles simples, 
voire minimalistes. 

Précisons aussi que nous continuons à vouloir répondre à la même question posée 
plus haut : l'imitation des agents situés dans le voisinage, permet-elle de retrouver les 
phénomènes? Nous venons de voir que l'imitation des choix, ne le permet pas. Voyons 
maintenant si d'autres formes d'imitation le permettent. 

3.4.1 Imitation de la conviction 

Partons de l'équation ffTSl) donnant le choix de l'agent i de la commune a, écrite sous 
la forme plus générale : 

S? = sign [hi + f + F + J . I v «] , (22) 

18 Nous n'exigeons d'un modèle que sa capacité à « sauver les phénomènes ». La question relative à sa 
véracité ne se pose pas encore à nous, pour l'heur(e). 
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où I Va représente l'influence que reçoit un agent d'une commune a. (Précédemment, I Va 
était égal à m Va , à cause de l'imitation des choix.) Nous cherchons ici, une façon différente 
d'exprimer le terme d'influence I Va , autrement dit une façon qui ne repose pas sur une 
imitation du choix des agents. 

Dans l'équation ci-dessus, le choix S*f = ±1 de l'agent i dans la commune a résulte 
d'une réduction de ce que nous appelons sa conviction : 

c? = h i + f a + F + J.I v «. (23) 

(Si cf > alors Sf = +1, ou —1 dans le cas contraire.) Notons que ce que nous appelons 
conviction —au regard du choix à faire— est une grandeur réelle non bornée et à une seule 
dimension. 

Il semble convenable d'imiter non pas les choix Sj = ±1 des agents j dans les com- 
munes (3, mais leur conviction Cj. Pourquoi? 

Premièrement, à cause de l'élection en tant que telle : une décision à prendre de façon 
quasiment synchrone (le même jour pour tous les agents). Les agents ne peuvent alors 
imiter les choix ±1 des autres agents, puisqu'ils n'ont pas encore été réalisés, ou ne le 
connaissent pas. Le caractère secret que le vote peut avoir, renforce la difficulté à imiter 
les choix lors d'une élection puisqu'ils ne sont pas forcément connus. Tous les électeurs ne 
disent pas non plus de façon certaine pour qui ils vont voter. Deuxièmement, notamment 
dans une discussion, une personne ne se réduit pas à un choix ±1. Il paraît vraisemblable 
qu'un individu à forte conviction puisse influencer davantage qu'un autre individu peu 
convaincu, mais faisant tous deux le même choix le jour de l'élection. (Cette vraisem- 
blance n'est pas partagée par les adeptes des modèles à opinion continue et confiance 
limitée.) Ainsi, l'imitation procède des agents eux-mêmes, i.e. de leur conviction, avant 
leur réduction en choix ±1 le jour de l'élection. (Cette réduction de la conviction au choix 
±1 s'apparente à une opération de mesure, à une « réduction du paquet d'onde » se lais- 
seraient à dire les chantres de la mécanique quantique.) 



Voyons maintenant comment s'écrit le modèle où l'imitation porte sur la conviction 
des agents, et non plus sur leur choix. 

I Va s'obtient de manière identique à ce qui avait été fait pour m Va (cf. Eq. (ÎT4l) ). soit 

E, 3 ESexp(-^) 

Notons h a , la conviction moyenne des agents de la commune a. Cette grandeur mesu- 
rable s'exprime comme 

p a = V > [-h a ], (25) 

puisque p a = V[hi + h a > 0]. Rappelons que les idiosyncrasies, h i: uniformément réparties 
sur l'ensemble des communes, ont une moyenne nulle. 

Avec cf = hi + h a mis dans Eq. (|2~3| . et cf donné par Eq. (Î2"3l . il vient : 

h a = K a ■ h Va + (1 - K a ) f a + I f , (26) 

1 J 

où _^ 

h V a = E^aP^a'^ ^ (2?) 
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dans laquelle pp^ a est défini par l'équation (ÎT5|) . et 



K' 



■a 



J 



K = J , 



(28) 



1 + x a (1 - J) 



où x a traduit le poids relatif des agents de la commune a par rapport à tous les autres, 
et s'exprime comme 



Plus l c augmente, plus x a diminue et varie peu d'une commune à une autre, en accord 
avec la plus grande uniformisation imposée par les plus grandes échelles de longueur. Dans 
la pratique, pour l c > 4, 5 km, tous les K a prennent environ la même valeur K. Noter 
enfin que si J = 0, alors K a = K = 0, et si J = 1, K a = K = 1 et ±f^- = 1 + x a . Enfin, 
le passage de h a au résultat électoral (ou au taux de participation) de la commune utilise 
l'équation ( |25j) . 

Avant de mieux comprendre ce qu'implique ces équations, voyons une autre façon 
possible de traduire l'imitation. 

3.4.2 Imitation indirecte via les lieux de résidence 

Dans la partie ci-dessus nous avons écrit le terme d'influence I Va d'une façon différente 
que celle due à l'imitation des choix. Dans les deux cas, l'imitation des choix ou l'imitation 
des convictions, I Va peut être considérée comme une influence directe : celle que reçoit 
un agent i d'une commune a de par les agents de son voisinage. Nous allons maintenant 
nous tourner vers une autre forme d'influence, indirecte celle-ci. 

Pour cela, nous commençons par simplifier l'équation générale (I2"2"j) en lui supprimant 
le terme de l'influence directe des agents du voisinage I Va . Le choix d'un agent i qui réside 
dans la commune a s'écrit alors Sf = V\hi + F a > 0], où F a = F + f a . Ce qui amène 
tout simplement pour une commune a à 



Essayons maintenant de mieux comprendre le rôle de F a = F + f a dans l'équation 
générale (j2"2"]) . Nous avons vu à la section [3.3. Il que la dénommée tendance spécifique, f a , 
de la commune a pouvait s'interpréter, soit comme un champ appliqué qui se surajoute à 
un champ global F, soit comme un déplacement de la moyenne des idiosyncrasies des habi- 
tants de la commune a. N'entrons pas dans des querelles de Byzantins pour savoir laquelle 
de ces deux interprétations convient. Peu importe, rien ne change mathématiquement. 

La discussion précédente peut s'étendre de f a à F a = F + f a . Ainsi, d'une manière ou 
d'une autre, F a traduit mathématiquement la tendance globale des agents de la commune 
a à se positionner sur le choix demandé. Écrite selon la notation de la section 13.4.11 
pa _ foa ^ s'interprète comme la moyenne des convictions des agents de la commune 
a. Peu importe ensuite que cette tendance globale, ou moyenne des convictions, puisse 
être expliquée par l'histoire des gens de la commune, par un état de fait qui résulte de la 
façon dont la commune est peuplée, par une réponse spécifique des agents de la commune 
face au choix demandé, par le rôle de certaines personnes, de certains établissements, par 
intérêt stratégique global, etc. Il est essentiel de remarquer que F a traduit, certes une 
tendance globale des agents de la commune (terme flou), mais, surtout, un aspect qui 
engage l'ensemble des agents de la commune. Une tendance incarnée ou subie (selon les 




a 



(29) 



p° = p>[-F a ] . 



(30) 
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deux interprétations de f a ), bref, une tendance partagée par l'ensemble de ses agents. Peu 
importe ensuite l'origine, ou l'explication, ou encore l'interprétation de F a . Il manifeste à 
nos yeux l'expression mathématique d'une tendance globale des agents d'une commune. 
(A ce stade F a traduirait donc l'hypothétique proverbe : « qui s'assemble se ressemble. ») 
Il serait des plus surprenants que cette tendance s'arrête aux limites de la commune —à 
l'encontre d'un certain nuage radioactif qui n'aurait pas franchi les frontières d'un certain 
pays, il y a de cela quelques années déjà— et que les communes contiguës ne partagent 
pas, à un certain degré, cette tendance globale. (Un type géographique, rural, urbain, etc., 
ne se limite pas souvent à une seule commune, semble-t-il.) 

Traduisons cela en termes mathématiques. 

Il paraît vraisemblable que la tendance globale, F a , de la commune a partage, à un 
bruit près, la même tendance globale que ses voisines, notée F Va , ainsi qu'une tendance 
générale ou nationale, notée F. Ainsi, 

h ■ (F v « - F a ) +k 2 -(F- F a ) = V a , (31) 

où ki et k 2 sont deux réels positifs (à l'instar des constantes de rappel des ressorts), et 
7] a , une variable aléatoire décorrélée —et toujours pour la même raison, afin que l'écriture 
minimaliste ci-dessus ne contienne pas d'autre information résiduelle ou cachée. 
L'équation ci-dessus s'écrit tout simplement comme 

F a = K ■ F Va + (1 - K) ■ F + r]' a , (32) 

où K = k h ^ k et rf a = fc ~^° a . Il est important de noter que F Va capture ici les effets dus 
à la proximité, i.e. les interactions avec le voisinage. 

Après ces longues tergiversations sur la tendance globale F a d'une commune, sur 
son rapport au voisinage, nous voilà avec les mêmes équations que celles obtenues pour 
l'imitation directe de la conviction (cf. Eqs. (I25H26I) à comparer avec Eqs. (I32H30D ). Tout 
ça pour rien ? 

Il est d'une part rassurant de retrouver les mêmes équations pour les tendances globales 
des communes que pour celles celles obtenues à partir de l'imitation de la conviction. 
La tendance globale F a peut effectivement provenir d'un partage, d'une imitation, des 
convictions des agents de la même commune. Mais plus intéressant encore, l'approche par 
tendance générale permet de comprendre plus naturellement une autre façon d'imiter que 
celle qui procède de l'imitation directe des convictions. 

L'imitation des convictions des agents rend naturellement l'influence d'une commune 
j3 sur un agent de a, proportionnelle à la population de (3. En effet, l'équation (1271) fait 
intervenir pp^a, défini par Eq. (115p . proportionnel à N@. Est-il possible d'obtenir un terme 
d'influence indépendant de la population ? 

Oui, savons-nous, si l'agent i de la commune a interagit avec des agents indépendamment 
de la taille des communes (cf. Eq.([T7J). Autrement dit, s'il interagit, à distances de com- 
munes égales, avec le même nombre d'agents par commune, et ce quelles que soient leur 
taille. Qui plus est, avec des agents aux convictions aléatoirement réparties, pour que 
Eq. f l2"TI) reste valable. Bien que plausible, cette argumentation paraît assez artificielle. 
Autrement dit, il paraît plus vraisemblable qu'un modèle reposant sur une imitation de la 
conviction fasse intervenir la population des communes, plutôt que non ; et donc décrive 
P/3^ a par Eq. ( ÎT5|) plutôt que par Eq. ( 1171) . 
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Les discussions ci-dessus au sujet des tendances globales F a des communes vont pou- 
voir maintenant jouer leur rôle, et ce pour mieux appréhender une imitation indépendante 
du nombre d'agents. 

Il paraît vraisemblable qu'une tendance globale d'une commune puisse s'étendre à ses 
voisines indépendamment de sa population. Cette diffusion de la tendance proviendrait 
alors, davantage de sa localisation, de sa position spatiale, que du nombre de ses habitants. 
Autrement dit, au regard de cette tendance globale et partagée par l'ensemble des agents, 
les lieux de résidence importent plus que le nombre d'habitants. Ce genre de tendance 
globale, incarnée ou subie, par l'ensemble des agents d'une commune s'apparente —certes, 
assez lâchement— au proverbe bien connu, « qui se ressemble s'assemble ». Il traduit 
simplement que les habitants d'une zone géographique donnée partagent en commun une 
même tendance, indépendante du nombre de sa population, et non circonscrite aux limites 
de la commune. Nous pourrions peut-être y voir des zones rurales, urbaines, résidentielles, 
d'immigration, etc. De plus, ce partage de tendance globale peut-être considérée non pas 
comme une influence directe des choix ou des convictions, mais plutôt comme une influence 
indirecte entre agents —si le terme d'influence convient encore—, autrement dit comme un 
point commun partagé par les agents, sans pour autant qu'ils se convainquent directement. 
Ce que nous appelons imitation, interaction, influence, se conçoit ici comme l'expression 
d'une simple similarité —en rapport aux choix à faire lors des élections— des agents, due 
à la contiguïté des communes dans lesquelles ils résident. 

Bref, il ressort des discussions précédentes qu'un comportement commun entre zones 
voisines, et indépendant du nombre de population, se comprenne facilement par l'in- 
termédiaire d'une tendance globale partagée par les habitants qui y résident. Ce com- 
portement commun —qui donne la primauté aux lieux de résidence sur le nombre de 
population— a l'aspect d'une influence collective entre agents, sans pour autant qu'il y 
ait une influence directe entre agents de leurs convictions, ou de leurs choix. Cette forme 
d'influence —ou d'interaction, ou d'imitation— indirecte sera notée, faute de mieux, in- 
fluence indirecte via les lieux de résidence, et exprime pp^ a par Eq. ffTTj) . plutôt que par 
Eq. (H5&. 

Nous voilà plongés dans une nouvelle querelle de Byzantins, dans de nouvelles exégèses, 
dans des interprétations sans fin... diriez- vous. Certes. Mais nous voulions distinguer deux 
types possibles de ce que nous appelions, imitation, influence, interaction. Il est temps 
maintenant de se résumer et de tester ces genres d'imitation. 

3.5 Modèle à tendances communales statiques 

Un modèle dit à tendances communales statiques, ou plus simplement à tendances 
statiques, permet d'écrire les deux variantes ci-dessus de ce que nous appelions imitation. 
Il se rapporte à F a , la tendance globale, ou le champ appliqué global, ou la moyenne des 
convictions des agents, de la commune a tel que 

F a = K.F Va + f a , (33) 

où le choix binaire de l'agent i de cette commune s'écrit comme Sf = V\hi + F a > 0]. 
Le résultat (ou taux de participation) de la commune a est p a = P>[— F a ], comme à 
l'équation ( Î3Ô1) . 

Il est important de noter que les tendances spécifiques aux communes, notées f a , 
doivent être décorrélées entre elles si nous voulons que les traits saillants de ce modèle 
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reproduisent les données — i.e. que le modèle ne contienne pas d'information résiduelle qui 
parasiterait le crédit donné à un éventuel accord du modèle avec les phénomènes observés. 
Enfin, il parait vraisemblable que les particularités propres aux communes, f a , puissent 
être considérées comme stationnaires tout au long du processus qui aboutit à l'élection. En 
résumé, dans ce modèle, comme dans le précédent avec imitation des choix, les tendances 
communales sont aux communes ce que les idiosyncrasies sont aux agents : i.i.d. (et donc 
non corrélés), et fixes au cours du temps considéré. 

Dans ce modèle, F Va contient l'influence —au sens large— du voisinage sur un agent 
d'une commune a, autrement dit F Va exprime l'une des formes d'imitation vue ci-dessus. 
Il s'écrit comme 



où P/3^ a dénote le poids relatif de l'influence de la commune (3 sur la commune a. 



(34) 



Remarques : 

- nous aurions pu écrire F a = K . F Va + (1 — K) . F + f a , équation dans laquelle 
(F a ) = F et (f a ) = 0, où (...) signifie la moyenne sur l'ensemble des communes. 
Mais nous verrons plus bas que modifier la moyenne d'ensemble, (F a ) = F, n'a 
aucune importance sur les propriétés du système. Par la suite, nous imposerons au 
système (lors des simulations ou de son analyse théorique) une moyenne nulle de ses 
tendances spécifiques, soit (f a ) = 0. 

- nous aurions dû attribuer un coefficient d'interaction, K a , à chaque commune a 
comme à l'équation (126]) . Mais dès que l c est suffisamment grand (l c > 4, 5 km) 
alors K a ~ K, à cause du lissage à l'échelle de l c des disparités de la répartition 
locale de population. Par la suite, K sera assimilé à une valeur uniforme pour toutes 
les communes a, ce qui néglige de la sorte les hétérogénéités locales de la répartition 
des communes ou des population, à l'échelle de l c . 

Il faut maintenant distinguer deux variantes du modèle. 

- Dans le cas où l'interaction avec le voisinage provient d'une imitation dite de convic- 
tion, p/3^ a prend la forme donnée à l'équation ffTol) . soit : pp^. a = N@ . exp(— ^). 

- Dans le cas où l'influence provient de la dénommée influence indirecte via les lieux 
de résidence, pp^ a prend la forme donnée à l'équation ( TTT1) . soit : pp-* a = exp(— ^p-). 

Avant d'analyser l'équation f[3"3"j) correspondante au modèle des tendances communales 
statiques, il sera intéressant de remarquer le point suivant, qui reliera directement F a à 
r a utilisé tout au long de la première partie de cette thèse. En choisissant de nouveau les 
idiosyncrasies hi, i.i.d. selon une distribution gaussienne de moyenne nulle et de variance 
unité, il vient p a = |erfc[^^]. Si nous avions utilisé une distribution logistique des idio- 
syncrasies, de moyenne nulle et de variance unité, nous obtiendrions p a = 1+exp ^F a /Vs) ' 
Ce qui aurait conduit à identifier la grandeur r a (cf. Eq. ((2])) utilisée jusqu'alors à la 
tendance globale F a de ce modèle. Plus précisément et avec les conventions adoptées, r a 
aurait été égal à F a à un coefficient ^ multiplicatif près. 

Nous maintiendrons néanmoins une distribution gaussienne des idiosyncrasies, en ac- 
cord avec les considérations de simplicité et de généralité développés précédemment (cf. 
section 13.3.2p . Et puisque les distributions gaussienne et logistique ne sont pas trop 
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différentes l'une de l'autre, nous retiendrons que 



r a ~^-F a . (35) 
\/3 



3.5.1 Analyse et conditions de stabilité du modèle 

K exprime l'intensité des effets dus au voisinage. Si K = 1, l'équation précédente se 
rapproche d'une équation de diffusion en présence d'un champ aléatoire, f a , fixe et localisé 
dans chaque commune a. K > signifie une tendance à la concordance entre communes 
voisines, alors que K < impliquerait, au contraire, une tendance à l'opposition. 

L'annexe [F] étudie les conditions de stabilité de l'équation (Î33l) —en utilisant la trans- 
formation de Fourier de cette équation linéaire. Il ressort de cette annexe que les solutions 
sont toujours stables à temps long : 

- avec K < 1 ; 

- avec K = 0, mais en ajoutant la condition Yl a f° = 0- 

Le modèle des tendances communales statiques, défini par les équations (I33H34P . est 
un modèle linéaire. Ceci facilitera par la suite son étude analytique. Mais plus intéressant 
encore, cette linéarité empêche l'existence d'un point critique. Et nous avons déjà vu, lors 
de la réfutation du modèle RFIM avec imitation des choix, toute l'importance que revêt 
l'existence ou non d'un point critique. (Ce qui ne signifie pas non plus, bien évidemment, 
que tout modèle sans point critique est, ici, un bon modèle.) 

Le système comporte a priori trois paramètres, ajouté à cela les conditions initiales de 
F a . Les trois paramètres sont, l'intensité de couplage K, la longueur caractéristique l c de 
prise en compte des distances des communes voisines et l'écart-type 07 des f a . Puisque le 
système est linéaire, 07 n'a aucun effet sur les corrélations spatiales C(R) engendrées par 
le système. Les conditions initiales ne jouent aucun rôle —dans les solutions d'équilibre 
stable, les seules prises en compte comme nous l'avons déjà discuté dans l'annexe [F]-, 
hormis un décalage global de la moyenne de l'ensemble des F a . Remarquons au passage 
que les observations faites sur les résultats (ou les taux de participation) des élections, 
attestent des caractéristiques indépendantes de la moyenne des r a , qui comme nous l'avons 
vu, a une très forte accointance avec F a . Enfin, La moyenne des f a peut être réinjectée, 
à un coefficient près, dans celle, sans importance, des F a —excepté si K = 1, auquel cas 
cette moyenne doit être nulle, pour s'assurer de la stabilité du système. Indiquons alors 
que la moyenne des f a sera toujours nulle par la suite, dans les simulations que nous 
ferons ainsi que dans l'étude analytique du modèle. 

En résumé, le modèle ci-dessus ne contient que deux paramètres pertinents : le co- 
efficient de couplage, ou de l'intensité d'interaction avec le voisinage, K, et la distance 
caractéristique de la prise en compte de la proximité, l c . Enfin, notons le caractère avan- 
tageux d'un modèle à deux paramètres pertinents, puisqu'il facilite grandement son étude 
et sa comparaison avec les données. 

Essayons maintenant de tester, ne serait-ce qu'imparfaitement, laquelle des deux va- 
riantes du modèle convient le mieux aux données. Serait-ce la variante qui provient de 
l'imitation dite des convictions, ou l'autre qui se réfère à une imitation dite indirecte et 
via les lieux de résidence? Nous profiterons de l'occasion pour tester, ne serait-ce en- 
core qu'imparfaitement, la validité de l'hypothèse utilisée jusqu'alors : la restriction de 
l'influence au voisinage géographique. 
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3.5.2 Le classement des variantes 

Nous allons tester et classer entre-elles, trois variantes de ce modèle. Chacune d'elle 
porte sur l'expression de pp^ a de l'équation ( 1311) du modèle. 

La première variante interprète préférentiellement le modèle en terme d'une imitation 
dite indirecte et qui passe par les lieux de résidence. Ou peu importe l'interprétation, pp^ a 
—qui représente le poids relatif de l'influence d'une commune j3 sur une autre commune 
a — est donné ici par l'équation (fTTj) . indépendante des populations des communes. En 
outre, seules les communes (3 proches de la commune a sont prises en comptes (cf. la 
décroissance exponentielle en distance). 

Avec la deuxième variante, pp^a, dont l'expression est à donnée à l'équation ( ÎT5j) . 
est proportionnelle à la population des communes et ne prend encore en compte que le 
voisinage. Une interprétation en terme d'imitation des convictions des agents du voisinage 
de a —et ce, avec une imitation basique, sans aucune particularité— semble ici la plus 
convenable. 

Enfin la troisième variante, donnée par l'équation (12T1) pour pp^a, correspond encore 
à une imitation des convictions —puisque pp^ a est proportionnel à la population des 
communes—, mais ici, non circonscrite aux agents des communes voisines de a. Cette 
écriture provient d'une extrapolation des observations empiriques [111110] des probabilités 
d'appel, et de la durée des communications téléphoniques, entre personnes de différentes 
villes belges, d = 2 a été observé par les auteurs des deux articles ci-dessus. Ici, la valeur de 
l'exposant d testé peut prendre des valeurs comprises entre et 10, 5 par pas de 0, 5. d = 
signifie que la distance réelle entre deux communes n'a strictement aucune importance, et 
plus d augmente, plus l'importance des communes voisines de a augmente par rapport aux 
communes lointaines. Nous testons, par ce biais, la pertinence de l'hypothèse dans laquelle 
nous nous sommes volontairement cantonnés ici : restreindre l'imitation, l'influence au 
voisinage. 

L'annexe O teste et compare ces trois variantes, et ce à partir des résultats (ou des taux 
de participation) des élections. Le critère à la base du test est l'absence de corrélations des 
tendances spécifiques f a . Avec un modèle idéal, les corrélations spatiales des f a devraient 
être nulles comme nous l'avons écrit plus haut. Dans cette annexe, les f a sont estimés à 
partir des données, ce qui permet ensuite de calculer leur corrélation spatiale afin d'évaluer 
leur degré d'indépendance. Noter enfin que cette méthode convient particulièrement à un 
modèle linéaire sans point critique. 

Il ressort principalement de cette analyse les deux points suivants : 

- Les zones d'imitation paraissent être limitées au voisinage ; 

- Le modèle interprété comme imitation indirecte via les lieux d'habitation semble le 
plus convenable des trois. 

Bien évidemment, ces conclusions sont d'autant plus catégoriques que le modèle convient 
aux données. Même s'il semble assez convenable (le rapport des corrélations spatiales des 
f a estimés sur celles des résultats réels est de l'ordre de 10~ 2 ), nous verrons par la suite 
qu'un autre modèle convient mieux aux données. Bref, bien que l'analyse ci-dessus ne 
soit pas catégorique, elle fournit néanmoins des informations non négligeables quant à la 
possibilité de restreindre l'influence au voisinage, et au meilleur accord des données avec 
P/3-, a exprimé par l'équation. (fïTj) . 

Un facteur de qualité lié à l'indépendance des f a estimés, n'est pas la seule source 
possible de confrontation du modèle avec les données. Il existe une autre voie associée aux 
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corrélations spatiales, et qui se révélera par la suite particulièrement efficace et discrimi- 
nante. 

3.5.3 Corrélations spatiales, théoriques et numériques 

Nous commencerons l'étude des corrélations spatiales produites par ce modèle par leur 
calcul analytique, mais fondé sur une forte simplification. Ensuite, elles seront établies à 
partir de simulations numériques, mais sans simplification. Nous pourrons alors comparer 
les formes obtenues des corrélations spatiales avec celles provenant des données, en vue 
de retenir ou non ce modèle. 

Les équations (I33H34I) qui caractérisent ce modèle sont linéaires. Elles se prêtent donc 
aisément à un traitement avec les transformées de Fourier. Le calcul analytique peut abou- 
tir assez facilement à la condition de considérer une répartition uniforme des communes 
(ou une répartition uniforme des populations dans le cas où Eq. f|T5|) définit p^ a ). 

L ' annexe IH1 calcule explicitement les corrélations spatiales C(R) du modèle en fonction 
de ses deux paramètres pertinents, K et l c (cf Eqs (IH-9[ IH-10p ). Les figures [Toi tracent 
ces corrélations pour différentes valeurs de K et de l c , à partir des équations ( 1H-91 IH-1Ô1) . 
Dans ces figures, la distance caractéristique de la taille du système (i.e. de la France) vaut 
L = 500 km, et la distance caractéristique minimale (i.e. la distance caractéristique de la 
commune) vaut a = 2 km. Nous utilisons la même notation que celle de la section [2.1.51 à 
savoir R = (comme aux figures 131 et [TT|) . avec r en km et D, la distance moyenne entre 
deux communes d'un département, qui est constante ici et vaut 2, 7 km. 

Bien que les distances qui interviennent dans le tracé des corrélations spatiales théoriques 
s'appuient sur les distances réelles (L, a et D) du système étudié, ces figures ne doivent 
pas être prises en compte rigoureusement. Elles reposent en effet sur une répartition uni- 
forme des communes, voire des populations. Il suffira de se reporter aux figures IA-4[ pour 
se persuader, si besoin est, du caractère non rigoureux de cette hypothèse. (A noter que 
l'hypothèse de la répartition uniforme de la population est nettement plus fallacieuse que 
celle de la répartition uniforme des communes —à cause des lois de puissance qui y in- 
terviennent [12]). Néanmoins elles fournissent une bonne indication sur ce que devraient 
être les corrélations spatiales en l'absence de fortes hétérogénéités dans la répartition des 
communes, et si nécessaire des populations. 

Passons maintenant aux corrélations spatiales provenant des simulations numériques 
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FlG. 17 - Corrélations simulées obtenues avec le modèle des tendances statiques, pour différentes 
valeurs de K et de l c . (Voir Figs. [3] et [TT] pour les corrélations spatiales des résultats et des taux 
de participation, ainsi que pour la notation.) 



du modèle. 

Les figures [T7] tracent les corrélations spatiales obtenues numériquement à partir du 
modèle. Elles correspondent aux solutions stables du modèle. (Si if = 1, il faut au 
préalable contraindre J2 a / a — pour que les solutions ne divergent pas.) Les tendances 
très générales dessinées par l'étude théorique se retrouvent ici. A savoir, si l c diminue, alors 
la portée de corrélations augmente, et la valeur des corrélations avec les proches communes 
diminue. Et naturellement, si l'intensité d'interaction K augmente, alors augmentent aussi 
la portée des corrélations ainsi que la valeur des corrélations avec les communes voisines. 
De plus et en n'étant pas trop exigeant, excepté aux faibles distances l'allure des courbes 
simulées s'apparente à celle des courbes théoriques. 

Mais aucune de ces courbes —ou, par extrapolation, de ces genres de courbes— res- 
semble suffisamment aux courbes réelles (cf. Figs. [ïï] et ITT1) . à nos yeux. La valeur des 
corrélations à courte distance conjuguée à la portée des corrélations pourraient certes 
convenir, mais leur forme se distingue trop nettement d'une allure quasi-logarithmique 
observée avec les courbes réelles. 

Ce modèle ne peut donc être retenu, puisqu'il produit des corrélation spatiales qui 
s'cartent trop de celles des données réelles. Faut-il pour autant rejeter en bloc ce modèle ? 

Avant de répondre à cette question, voyons ce qu'apporte ce modèle. 

3.5.4 Bilan 

Comme nous l'avons vu dans la section consacrée à l'analyse de ce modèle, sa linéarité 
implique un comportement indépendant de la moyenne globale des F a . Ce qui s'accorde 
avec les régularités observées et résumées à la section 13.1. Il — en se rappelant de la similarité 
entre F a et r a . De plus, la distribution des F a (non montrée ici) est unimodale, sauf quand 
K ~ 1. De même, la moyenne des F a en fonction de Fq (où Fq dénote, à l'instar de Tq, 
la moyenne des F 13 sur les n p = 16 plus proches communes de la commune centrale a) 
se comporte sensiblement comme une droite de pente unité (non représentée ici). Enfin, 
les corrélations obtenues sont à longue portée. Les valeurs obtenues des corrélations entre 
proches voisins peuvent convenir avec les résultats réels. 

Rappelons que le modèle à tendances communales statiques répond à l'objectif que 
nous nous étions fixés dans cette partie consacrée à la modélisation : faire ressortir les 
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phénomènes observés à partir d'une simple imitation, ou influence, due au voisinage. 

En résumé, ce modèle a de bonnes raisons d'être retenu, hormis la forme des corrélations 
spatiales qu'il génère. Ainsi, plutôt que de l'abandonner, nous tenterons de l'amender. 

Un dernier point avant de chercher à améliorer le modèle des tendances communales 
statiques. Les tests et le classement des trois variantes du modèle ne sont pas en toute 
rigueur exacts, puisque le modèle ne convient pas en toute rigueur. Les tests des variantes 
réalisés ci-dessus nous convie néanmoins à préférer une imitation des agents sous la forme 
indirecte de ce que nous avions appelé, les lieux de résidence, plutôt que celle émanant 
d'une imitation directe dite de conviction. En outre, ils accréditent l'hypothèse d'une 
imitation restreinte au voisinage de la zone d'habitation des agents. 

3.6 Dynamiques tendances 

Comment modifier le modèle précédent à tendances communales statiques, tout en 
étant fidèle à nos objectifs —retrouver les phénomènes à partir d'une forme simple d'imi- 
tation, limitée au voisinage ? La modification ne portera pas sur la forme d'imitation 
puisque l'imitation exprimée par le modèle précédent satisfait déjà aux critères de sim- 
plicité. La changer, signifierait la compliquer, la complexifier. (Nous n'entendons pas non 
plus revenir à une imitation des choix, précédemment invalidée.) Nous ne remettons pas 
non plus en cause la description —adoptée jusqu'ici— du choix d'un agent i de la com- 
mune a, en terme d'idiosyncrasie fixe au cours du temps, et tel que S? = sign[/ij + F a }. 
En se penchant sur l'équation générale du modèle (Eq. [33]) , il ne reste alors plus qu'une 
possibilité : modifier les tendances communales statiques, f a . 

Comme nous l'avions déjà évoqué, les tendances communales spécifiques doivent être 
décorrélées, et ce pour que le modèle satisfasse aux objectifs impartis. Dans le cas contraire, 
les corrélations des f a masqueraient d'autres informations que celles mises en avant par 
le modèle, et brouilleraient de surcroît l'action de la seule imitation. En d'autres termes, 
un modèle avec un ensemble de f a corrélées et non indépendantes, pourrait certes fournir 
des solutions en accord avec les données, mais ne pourrait en aucun cas avaliser l'hy- 
pothèse d'une imitation responsable des phénomènes —ou qui permettrait de retrouver 
les phénomènes. (Précisons que nous ne rejetons pas l'existence des f a corrélés, ou ex- 
pliqués par d'autres facteurs quantitatifs, comme par exemple la taille de la population 
des communes, mais que nous n'en tenons volontairement pas compte : elle ne permet 
pas de répondre à la question centrale que nous nous étions posée en début de chapitre.) 
Comment alors modifier les tendances des communes f a tout en préservant leur absence 
de corrélation ? 

Il ne reste plus qu'une possibilité : casser leur aspect statique. Rien n'empêche en 
effet de considérer les tendances communales comme fluctuantes au cours du temps où 
s'élabore la prochaine élection. Avec le modèle précédent, elles étaient fixes au cours du 
temps considéré —à l'image des idiosyncrasies des agents. Mais il semble plausible qu'elles 
évoluent, qu'elles changent pendant, ou avant, la campagne électorale. Par exemple, l'effet 
d'un événement particulier et local, la réaction à une information pas forcément locale, les 
changements de population au sein d'une commune, peuvent affecter la dénommée ten- 
dance propre de la commune, et la modifier. En revanche, pour que ce modèle réponde à 
nos objectifs, les variations des tendances communales doivent être également décorrélées 
les unes des autres. (Si elles étaient parfaitement corrélées, nous retrouverions le modèle 
précédent avec un champ global F appliqué à l'ensemble des communes, non pas statique 
mais dynamique.) Nous le choisirons alors comme étant le plus simple possible, i.e. un 
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bruit blanc gaussien, non corrélé. 



En résumé, le modèle dit à tendances communales dynamiques, ou à tendances dyna- 
miques, écrit au temps t le terme de tendance globale, ou le champ appliqué global, ou 
encore la moyenne des convictions des agents de la commune a, i.e. F a , comme : 



dt 

avec 



K.F Va (t)-F a (t) + f a (t) } (36) 



(f a (t).f(t)) a = a 2 f 5 aP , (37) 
(f a (t)-f a (t% = a}6(t-t'), (38) 

où crj, ô a/ 3 et S(t — t') dénotent respectivement la variance des tendances dynamiques, 
le symbole de Kronecker et la fonction de Dirac. F Va garde la même expression de 
l'équation flïïïïl) . dans laquelle pp-, a peut provenir de Eq. (fT7|) ou de Eq. ffTol) . 

La moyenne du membre de gauche de Eq. fIBTl) s'effectue sur l'ensemble des communes, 
et signifie qu'à un instant donné, les tendances des communes sont non corrélées. Cette 
équation reste valable pour le modèle des tendances statiques, mais avec des tendances f a 
indépendantes du temps. La moyenne du membre de gauche de Eq. (|38|) porte sur l'en- 
semble des réalisations pour une commune a au cours du temps, et signifie que la tendance 
d'une commune fluctue sans mémoire, i.e. sans être corrélée à son passé. Pour simplifier, 
et comme pour le modèle des tendances statiques, nous considérons les moyennes (tempo- 
relle ou étendue à l'ensemble des communes à un instant donné) des f a {t), comme nulles. 
Notons enfin que ce modèle se classe parmi les processus d'Ornstein-Uhlenbeck. 



3.6.1 Stabilité et paramètres pertinents du modèle 

Le passage du modèle des tendances statiques au modèle à tendances dynamiques, 
ne modifie que l'expression des tendances communales, qui, de statiques deviennent fluc- 
tuantes, f a — > f a (t). L'équation régissant le modèle est donc la même pour les deux —à 
l'aspect statique ou dynamique de f a près— comme le montrent les équations ( 1F-11I361) . Il 
en découle les mêmes conditions de stabilité et le même nombre de paramètres pertinents 
du modèle. 

Ainsi, les solutions du modèle ne divergent pas pour K < 1 ainsi que pour K = 1 
(mais pour cette dernière, avec la condition supplémentaire d'une moyenne, temporelle ou 
étendue à l'ensemble des communes à un instant donné, (f a {t)) = 0, comme nous l'avions 
prescrit lors de l'écriture du modèle des tendances communales statiques). 

Les paramètres pertinents de ce modèle linéaire sont encore au nombre de deux : 
l'intensité de couplage K, et la longueur l c caractéristique des distances du voisinage. 

Voyons maintenant ce qu'une étude théorique — étayée ensuite par des simulations— 
peut montrer sur les corrélations spatiales. 



3.6.2 Corrélations spatiales théoriques et conséquences 

Comme précédemment, le calcul analytique qui mène au corrélations spatiales des so- 
lutions du modèle se fonde sur l'hypothèse d'une répartition uniforme des communes, voire 
de la population si Pfs^ a en tient compte. L'annexe [H] détaille ces calculs, qui reprennent 
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1 = 1.5 km 1 =3km 1 =6km 
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FlG. 18 — Moyennes des corrélations théoriques obtenues avec le modèle des tendances dyna- 
miques et une répartition uniforme des communes, voire si nécessaire des populations. 



pour une bonne part ceux du modèle statique. Le caractère fluctuant des tendances com- 
munales influe néanmoins sur l'expression des corrélations, comme le montre Eq. (IH-141) 
comparée à son pendant du modèle statique, Eq. flH-101) . 

Les figures US] montrent, à partir des équations (IH-91 IH-Ï4|) . les corrélations spatiales 



du modèle dans le cadre d'une répartition uniforme des communes ou de la population. 
Les distances L, a et D prises en compte reprennent les valeurs de la section 13.5.31 qui se 
voulaient réalistes, i.e. en accord avec les distances réelles du système. Il est important de 
noter que les corrélations obtenues analytiquement sont des moyennes sur l'ensemble des 
réalisations. Et de nouveau, seules les solutions obtenues après le régime transitoire sont 
considérées. 

Les corrélations théoriques correspondantes à une répartition uniforme des communes 
—et des populations si pp^a en tient compte— ont une décroissance quasi-logarithmique 
pour la valeur K — 1. Elles en diffèrent nettement quand K ^ 1. La forme quasi- 
logarithmique obtenue avec K = 1 ne tient plus pour les les plus petites distances, ce qui 
n'est pas trop gênant puisqu'avec le modèle précédent, l'écart entre corrélations théoriques 
et numériques résidait essentiellement dans cette zone. 

Ce qui amène à se poser les deux questions suivantes? Premièrement, quel enseigne- 
ment tirer de la forme appropriée des corrélations spatiales théoriques? Deuxièmement, 
quelle signification donner au modèle avec la valeur particulière K = 1 ? 

Premièrement, l'accord des corrélations spatiales théoriques et réelles, justifie de nou- 
veau la restriction de l'interaction au seul voisinage. L'analyse théorique limite en effet 
le terme d'influence F Va à la proximité spatiale seule. Rappelons que les tests des trois 
variantes du modèle des tendances statiques accréditaient également l'hypothèse dans la- 
quelle nous nous étions placé dès le début de cette étude : l'interaction entre agents se 
cantonne aux agents du voisinage. 

Deuxièmement, avec K = 1 l'équation ( l36i) du modèle s'apparente à une équation de 
diffusion en présence d'une source bruitée. Noter que cette équation diffère d'une équation 
de diffusion au sens propre —définie avec un Laplacien— mais s'en rapproche puisque 
(F Vq — F a ) se comporte comme un Laplacien équivalent, (cf. Eq. (1F-5[) en annexe, où 
(F Vq — F a ) se comporte comme un Laplacien pour les grandes distances, mais s'en écarte 
pour les petites distances.) Bref, le modèle des tendances communales dynamiques peut se 
concevoir comme un modèle de type diffusif en présence d'un bruit blanc. Et de nouveau 
se pose la question : quel enseignement en tirer? Ou plus précisément, quel interprétation 
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en faire ? 

Que le coefficient K soit égal à un, autrement dit que le modèle se ramène à une 
sorte de diffusion, nous pousse à adopter l'interprétation d'une interaction sous la forme 
indirecte de la dénommée lieux de résidence, et ce au détriment de l'interaction directe via 
l'imitation de la conviction. En effet, une diffusion des tendances communales globales F a 
se comprend aisément par une interaction indirecte par le biais des lieux de résidence, où 
seule la distance entre communes intervient. Cette diffusion reflète alors l'homogénéisation 
locale des résultats (ou des taux de participation) électoraux, par delà le découpage en 
communes des zones d'habitation relativement homogènes. 

Nous pourrions arguer qu'une diffusion de la conviction semble également naturelle. 
Mais comment justifier à l'échelle microscopique que le coefficient K soit égal à un ? Autre- 
ment dit, comment naturellement comprendre que l'intensité de l'imitation de conviction, 
J, soit égal à un, alors qu'il peut prendre n'importe quelle valeur comprise entre et f ? 
(Rappel : J se retrouve dans l'équation générale (!22l) . et Eq. (l28l) exprime le lien entre K 
et J.) 

Précisons que nous n'avons pas la preuve formelle que l'influence procède d'une inter- 
action dite indirecte via les lieux de résidence, mais plutôt un faisceau de convergence. 
Ce faisceau de convergence provient des deux points suivants. Premièrement, la diffu- 
sion des F a se comprend plus facilement, à l'échelle microscopique, sous la forme d'une 
homogénéisation des tendances globales des lieux de résidence, plutôt que sous la forme 
d'une imitation directe des convictions des agents. Deuxièmement, les tests des trois va- 
riantes relatives au modèle des tendances statiques penchaient en faveur de l'imitation 
indirecte par le biais des lieux de résidence —et renforçaient de plus l'hypothèse d'une 
influence locale. 

Notons enfin que nous acceptons les conclusions de cette analyse théorique, puisque 
l'hypothèse d'une répartition uniforme des communes ne nous paraît pas complètement 
farfelue, du mois, à l'échelle locale ou départementale. 

Pour résumer, l'analyse théorique des corrélations spatiales du modèle des tendances 
communales dynamiques accrédite les trois points suivants. 

- L'interaction est bornée au voisinage spatial. 

- Le modèle est de type diffusif, i.e. K = 1. Ainsi, le modèle n'a plus qu'un seul 
paramètre pertinent à considérer, la longueur caractéristique, l c , de prise en compte 
des distances du voisinage. 

- L'interprétation d'une influence, appelée peut-être à tort, indirecte et au travers des 
lieux de résidences, est favorisée. 

Dit en terme mathématique : l'équation (1361) du modèle s'écrit avec K — 1, et pp-> a qui 
intervient dans l'expression de F Va provient de Eq. (fTTj) . 

Nous nous placerons par la suite dans ce cadre. Voyons alors ce que nous apprennent 
les corrélations spatiales numériques, établies non pas à partir de l'hypothèse d'une 
répartition uniforme des communes, mais à partir de leur position réelle. 

3.6.3 Corrélations spatiales numériques 

La figure fT9l de gauche montre les moyennes, après le régime transitoire, des corrélations 
spatiales issues du modèle des tendances dynamiques et pour différentes valeurs de l c . Les 
simulations s'effectuent sur un pas de temps élémentaire dt = 0, 1, et de façon synchrone 
—de manière à respecter le déroulement de l'élection au jour J. Le temps caractéristique 
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1 =4.5 km 

C 




FlG. 19 — Figure de gauche : moyennes —après le régime transitoire— des corrélations simulées 
du modèle des tendances dynamiques, et ce en fonction de l'unique paramètre libre, l c . (Ici, le 
modèle est de type diffusif, i.e. K = 1.) Figure de droite : Corrélations spatiales à différents 
temps (tj = 3, 9 10 5 + 500 . i) après le régime transitoire, avec l c = 4, 5 km. Dans la fenêtre, les 
valeurs des corrélations des proches voisins, C{r ^ 2D), à différents temps, et toujours avec 
l c = 4, 5 km. (Voir Figs. [3] et HU pour les corrélations spatiales des résultats et des taux de 
participation, ainsi que pour la notation.) 

du régime transitoire est égal à <^-p — — | (^f^j d'après les équations (1H-2| IH-91 IH-13H . 
où L = 500 km, caractérise la longueur caractéristique du système, i.e. de la France 
métropolitaine. Trois fois ce temps (pour que les transitoires comptent moins de 5% de la 
solution globale) donne t ~ 10 5 dans le cas où l c est le plus petit (l c = 1,5 km ici). Par 
souci d'homogénéité, les moyennes des corrélations spatiales de Fig. [191 s'obtiennent, pour 
chaque valeur de l c , à des intervalles de temps égaux à 500 et pour des temps t g]10 5 ; 2 10 5 ] 
(i.e. sur 200 réalisations différentes pour chaque l c après le régime transitoire). 

La figure HH] de droite montre 10 réalisations différentes des corrélations spatiales ob- 
tenues avec l c = 4, 5 km, et met en évidence les fluctuations — inhrentes à ce modèle de 
type diffusif en présence d'une source de bruit blanc— des corrélations spatiales. Ces fluc- 
tuations sont auto-moyennantes puisqu'il existe une moyenne théorique sur l'ensemble des 
réalisations. La fenêtre de cette figure le met en évidence qualitativement en représentant 
les valeurs de la corrélation avec les proches voisins au cours du temps, et toujours pour 
l c — 4, 5 km. Ces valeurs semblent en effet fluctuer autour d'une valeur moyenne et avec 
un bruit constant. 

Une chose est de tracer numériquement les corrélations spatiales du modèle, autre 
chose est d'en tirer des conséquences, d'en discuter. La section qui suit s'y attelle. 

3.6.4 Deux ou trois choses que je sais d'elles 

Le premier constat qui sort des figures est la perte de la forme quasi-logarithmique 
des corrélations spatiales, par rapport aux corrélations théoriques à grandes distances. 
Nous attribuons ce point à la non homogénéité de la répartition des 36200 communes sur 
le territoire français, comme le montre la figure IA-41 

Deuxième constat : la forme quasi-logarithmique des corrélations spatiales réelles, se 
rapproche nettement plus de la forme obtenue avec ce modèle qu'avec le modèle précédent 
des tendances statiques. 
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Troisième constat : la portée des corrélations correspond à peu près à celle des corrélations 
réelles, et ne dépend pas de la valeur de la corrélation entre proches communes {C(R ~ 1)) 
—à l'image des corrélations réelles. 

Quatrième constat : les corrélations spatiales fluctuent de façon non négligeable pour 
différentes réalisations, i.e. pour des temps différents; rendant par là même difficile une 
mesure précise du paramètre libre l c à attribuer à chaque élection. 

Enfin, cinquième constat : le modèle fait ressortir naturellement une distance ca- 
ractéristique du système —la distance qui sépare deux communes voisines. Autrement 
dit, pour que les simulations soient comparables aux corrélations réelles, le paramètre 
pertinent du modèle, l c , doit prendre sensiblement la valeur de la distance réelle séparant 
deux communes voisines (dans les environs de 3 km). 

Essayons de mieux comprendre la longueur caractéristique, l c , de prise en compte des 
distances intercommunales. La figure [T9l de gauche montre que la corrélation entre proches 
voisins augmente quand l c diminue. La figure EU] montre quant à elle, que l'écart-type des 
F a (ou des r a ) augmente quand l c diminue ; ce qui est en accord avec l'augmentation 
des corrélations spatiales entre communes. En comparant avec les corrélations réelles 
(cf. Figs. El [TT]) . il semble que l c vaille environ 4 km pour les résultats électoraux (sauf 
pour l'élection de 2000-b), et environ 7 km pour les taux de participation. Ceci s'accorde 
aussi avec un écart-type des r a supérieur pour les résultats électoraux que pour les taux 
de participation. (Encore faudrait-il plus rigoureusement tenir compte du bruit dû aux 
tailles finies des communes, point d'autant plus important pour un résultat électoral 
que la participation est faible, comme lors du référendum de 2000.) Bref, pourquoi cette 
différence de l c ? Ou mieux, comment comprendre qu'à chaque type de donnée électorale 
corresponde une valeur de l c qui lui est propre ? 

Plus l c diminue, plus le poids relatif de la, ou des plus proches communes de la com- 
mune centrale a augmente par rapport aux communes plus lointaines, comme l'indique 
directement l'exponentielle de p^ a dans Eq. ffTTj) . Au contraire, plus l c augmente, plus 
l'influence des plus proches communes se dilue par rapport aux autres communes plus 
lointaines. Dit encore autrement, quand l c diminue, la finesse de résolution de la prise en 
compte du voisinage augmente. Ceci nous incite à émettre l'hypothèse suivante : tout se 
passe comme si l'importance d'une élection —au regard des agents— pouvait se mesurer à 
l'aune de la finesse des détails du voisinage pris en compte. Avec l'idée —potentiellement 
contestable— qu'une expression d'un vote semble plus important aux yeux des agents 
qu'une participation à l'élection, il en résulte que l c est plus petit pour les résultats 
électoraux que pour les taux de participation. Et dans le rôle de l'exception qui confirme 
la règle : le résultat du référendum de 2000. Cette élection, aux taux de participation et 
de suffrages exprimés les plus faibles des douze étudiées (N expr ~ 0, 25 N insc à l'échelle 
nationale), n'a semble-t-il pas engagé profondément les citoyens français ni fait ressortir 
de profonds clivages idéologiques. Arrêtons-nous là sur les interprétations d'ordre poli- 
tique, et contentons nous après avoir émis cette hypothèse, de constater que l c paraît plus 
petit pour les résultats électoraux (référendum de 2000 excepté) que pour les taux de 
participation. 

Notons enfin que les simulations obtenues avec pp^ a proportionnel à la population 
des communes et donné par Eq. (ÎT5l) fournissent des corrélations spatiales qui s'éloignent 
encore plus de la forme quasi-logarithmique. Ce point semble accréditer la discussion 
précédente qui nous a poussé à préférer l'influence indirecte via les lieux de résidence, 
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FlG. 20 — Écart-type des r a sur l'en- 
semble des communes avec le modèle dyna- 
mique en fonction de l c , et pour un écart- 
type des tendances dynamiques Of = 1 (cf 
Eqs. (J3Z1 BEI». Rappel : r° ~ -^F a d'après 
Eq. ([35Î1 . Ces mesures ont été effectuées sur 
les mêmes réalisations (200 par valeur de l c , 
et après le régime transitoire) de la figurefTÏÏl 
de gauche. 



au détriment de l'imitation directe de la conviction. Mais qualitativement, ce plus grand 
écart avec la forme théorique peut aussi se comprendre par une plus grande inhomogénéité 
de la répartition de la population (y compris sur des zones de distance caractéristique l c ) 
comparée à l'hétérogénéité de la répartition des communes. 

Arrive maintenant la question fatidique : ce modèle est-il ou non satisfaisant ? 

3.6.5 Valider ou non le modèle 

Avant de savoir si ce modèle peut être validé ou non, essayons de quantifier, ne serait-ce 
qu' approximativement, ce que nous avions dit jusqu'ici qualitativement et à l'œil concer- 
nant l'allure quasi-logarithmique des corrélations spatiales. Nous utilisons pour cela le 
coefficient de détermination R 2 entre les corrélations spatiales et la forme logarithmique 
attendue. Autrement dit, nous cherchons comment les corrélations spatiales C(R) peuvent 
bien s'accorder avec la forme logarithmique voulue. Le coefficient R 2 indique en effet la 
proportion de variance expliquée, i.e. le rapport des variances de l'écart des données à la 
forme voulue sur les variances des données brutes (cf. Eq. (1B-5[) ) . (Plus R 2 se rapproche 
de 1, meilleur est l'accord entre les données et la forme attendue.) Dans le cas d'un ajuste- 
ment linéaire, R est simplement égal à la corrélation entre les données et la forme voulue. 
Ainsi, dans le cas qui nous intéresse, R est égal à la corrélation entre les corrélations 
spatiales, C(R), et la forme logarithmique ln(i?). (Il correspond à l'ajustement linéaire de 
C(R) avec a ln (jf;), où a désigne la pente de décroissance, et R c la longueur ou portée 
caractéristique des corrélations spatiales.) Notons enfin que les corrélations spatiales C(R) 
peuvent aussi bien provenir des données réelles que des modèles à tendances communales 
statiques ou dynamiques. 

La table [TOI évalue les coefficients R 2 des corrélations spatiales C(R) avec une forme 
de décroissance logarithmique. Les corrélations spatiales proviennent des données réelles : 
les résultats électoraux et les taux de participation sur l'ensemble des communes. Elles 
proviennent aussi du modèle à tendances statiques (avec K = 0,995 et l c = 12 km), 
ainsi que du modèle à tendances dynamiques (avec l c = 4 km). Ces paramètres des 
modèles reproduisent en effet une portée convenable des corrélations spatiales, conjuguée 
à une bonne valeur (comparée à celles des résultats électoraux) des corrélations à courte 
distance, C(R ~ 1), comme le montrent les figures [T7I et [TOI Excepté pour le modèle 
statique, les valeurs indiquées par la table [TOJ correspondent à des valeurs moyennes (sur 
12 taux d'abstention, 6 résultats électoraux et 200 réalisations du modèle dynamique). 

La table [TOI détermine ces coefficients R 2 de deux manières différentes. Premièrement, 
le calcul s'effectue sur R ^ 80 avec 40 points : R e]2n ; 2(n + 1)] où n = 0,1,..., 39. 
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Le choix arbitraire de 80 correspond environ à la portée des corrélations spatiales des 
résultats électoraux et des taux de participation. Noter que cette méthode donne plus de 
poids aux zones des plus grandes valeurs de R (par l'effet de ln(i2), la densité de points 
pris en compte est supérieure dans les zones à grand R, comparée à celle des zones à faible 
R). (Cette première façon de calculer R 2 se note « l ere façon » à la table [101) La seconde 
méthode pallie ce problème. Elle considère un espacement constant entre les points ln(R) 
considérés. En revanche le calcul s'effectue sur 7 points à peine, et pour R ^ 66, tels que 
R g] 2 . 2 n ; 2 . (2 n + 1)] où n = 0, 1, . . . , 6. (Cette seconde façon de calculer R 2 se note, on 
pouvait s'en douter, « 2 nde façon » à la table [TOI) 





l ere façon 


2 nde façon 


Taux de participation 


0,99 


0,99 


Résultats électoraux 


0,99 


0,98 


Modèle statique 


0,83 


0,86 


Modèle dynamique 


0,95 


0,93 



TAB. 10 — R 2 entre les corrélations 
spatiales C(R) et une forme logarith- 
mique. Voir texte pour les deux façons 
de calculer le R 2 . Modèle des ten- 
dances statiques : (K = 0, 995 ; l c = 
12 km). Modèle des tendances dyna- 



miques : l c = 4 km. 

La table [TU] confirme bien tous les jugements qualitatifs précédents. Premièrement 
les corrélations spatiales des taux de participation et des résultats électoraux ont bien 
une forme quasi-logarithmique. Deuxièmement, les corrélations spatiales obtenues avec le 
modèle des tendances dynamiques se rapprochent plus d'une forme quasi-logarithmique, 
que celles produites par le modèle des tendances statiques. Enfin, en moyenne, la forme 
des corrélations spatiales issues du modèle des tendance dynamique diffère, à proprement 
parler, de la forme des corrélations logarithmique. 

Mais la différence entre les corrélations spatiales du modèle des tendances dynamiques, 
et leur forme attendue (quasi-logarithmique), est-elle suffisante pour invalider le modèle? 
Autrement dit, l'écart entre les deux formes —mesuré de façon un peu plus quantitative 
à la table HPT - est-il acceptable ou non ? 

Il survient alors l'épineuse et incontournable question du seuil de tolérance. Face à 
cette embarrassante question, présentons néanmoins notre position. 

Notre jugement relatif à la validité du modèle des tendances dynamiques est donc 
mitigé. 

Nous ne pouvons rigoureusement pas valider le modèle des tendances dynamiques 
puisque les corrélations spatiales qu'il engendre diffèrent notablement, et en général, de 
la forme quasi-logarithmique afférente aux données. Néanmoins, l'écart ne nous semble 
pas être trop important au point de le rejeter complètement. L'écart à la forme quasi- 
logarithmique est d'ailleurs moins important qu'avec le modèle des tendances statiques 
—ce qui en soi, ne donne aucune justification du modèle dynamique. De plus, le modèle 
permet de retrouver (non montré ici) tous les autres phénomènes principaux à sauver 
énumérés à la section [ÏÏ7TTTJ Enfin, qu'un modèle à un seul paramètre puisse rendre compte 
des phénomènes majeurs, à l'exception de l'un d'entre-eux, et encore pas excessivement, 
nous semble très encourageant. 

Précisons aussi que nous n'attendons pas d'un modèle simpliste à un seul paramètre 
pertinent, à ce qu'il puisse rendre compte de toutes les particularités relatives à une 
élection. 

En conclusion, nous ne validons donc pas le modèle des tendances dynamiques, mais 



77 



le trouvons suffisamment encourageant pour ne pas le rejeter complètement. Plutôt que se 
focaliser sur la validation, ou non, du modèle, nous trouvons extrêmement encourageant 
le fait qu'un modèle à un unique paramètre pertinent, et bâti sur des principes microsco- 
piques plausibles, puisse s'approcher à ce point de l'ensemble des phénomènes majeurs à 
sauver. 

Précisons enfin qu'un accord avec l'ensemble des phénomènes majeurs à sauver ne 
signifierait pas automatiquement la validation du modèle. Encore faudrait-il à ce qu'il 
puisse rendre compte des phénomènes plus fins — énumérés à la section 13.1.11 La partie 
suivante illustre une confrontation plus fine du modèle aux données réelles. Elle montre 
de plus une voie possible d'amélioration du modèle dynamique : comme pour les solides, 
liquides et gaz, faire varier le coefficient de diffusion en fonction de l'état du système. 

3.6.6 Tentative d'amélioration et analyse plus fine 

Cette partie ne se veut pas rigoureuse puisque le modèle dynamique n'est, à ce stade, 
pas formellement valide. En revanche, elle indique une voie d'amélioration du modèle 
dynamique. Ce qui de plus, lui permet de se confronter aux phénomènes plus fins. 

Il ne paraît pas absurde de considérer que les tendances des communes fluctuent avec 
une intensité différente selon les communes. En outre, il paraît judicieux que l'amplitude 
des fluctuations de la tendance spécifique f a (t) de la commune a, dépende de l'état de 
ladite commune. Par rapport au modèle dynamique ci-dessus, f a (t) — > f a {t) = f a . rj a {t), 
où f a est fixe au cours du temps et rj(t) dénote un bruit blanc gaussien —pris de moyenne 
nulle et de variance unité— qui prend la valeur f] a (t) au temps t pour la commune a. 
T], comme précédemment, n'est ni corrélé en espace (entre différentes communes), ni en 
temps. Autrement dit, l'équation ( 1361) générale du modèle dynamique reste inchangée, 
mais les équations fl37l 138]) deviennent avec les mêmes notations : 



avec ({v a {t)) 2 ) t = 1 et ((f a ) 2 ) a = 0/- (Notons que la moyenne des f a est encore nulle.) 

L'intensité f a des fluctuations de la tendance propre de la commune a dépend ici de 
la commune elle-même. Par rapport à l'état de la commune, nous avons choisi f a oc -?=, 



certes arbitrairement, mais de manière à refléter aussi le bruit dû aux tailles finies des 
communes. 

L'annexe IH1 montre que les corrélations spatiales théoriques, selon cette contrainte et 
sous couvert d'une répartition uniforme des communes, garde la même forme que pour 
celles du modèle des tendances dynamiques vu précédemment. Les corrélations spatiales 
issues des simulations ressemblent très fortement —comme prévu— à celles de la figure [T9l 

Illustrons maintenant comment se comporte ce modèle face aux phénomènes plus fins 
à sauver. 

Des simulations ont été faites avec l c — 4, 5 km. 

Avec a/ = 1, l'écart-type des r a vaut 0, 16, à comparer avec des écarts-types au- 
tour de 0, 49 et de 0, 37 respectivement pour les résultats électoraux et pour les taux de 
participation. 

La corrélation entre cTg et n" nsc (voir Eq. ( ÎTU1) ) vaut 0, 85, à comparer avec celles des 
résultats et des taux de participation, aux alentours de 0, 66. La figure EU trace ctq (évalués 
ici à partir des grandeurs par commune) en fonction de nf nsc . Nous y apercevons une 



{rit) . f(t)) ( 

(F(t).f a (t')) 




(39) 
(40) 
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FlG. 21 — Moyenne des <Tq en fonction 
de Tvf nsc g, calculé avec 36 intervalles. Voir 
Figs. [7] et [15] pour les résultats et les taux 
de participation. 
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a 
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nette différence d'allure par rapport aux courbes réelles des figures [3, et [EU notamment 
dans les zones à forte population, i.e. à faible 7if nsc . 

Les corrélations temporelles effectuées avec 11 différentes réalisations donnent Ct(oo) = 
0, 72, à comparer avec 0, 57 qui prévaut pour les résultats et les taux de participation des 
élections. Le Ratio Significatif Minimum (voir annexe E|) est inférieur à 1%, en accord 
avec une absence d'information purement locale et différente du bruit dû aux tailles finies 
des communes. Noter que le temps équivalent séparant les 11 différentes réalisations est 
suffisamment grand pour qu'il n'y ait plus de mémoire entre les 11 ensembles des ten- 
dances spécifiques f a (t). Même si ce modèle était valable, il resterait encore à savoir si les 
ensembles des tendances propres, f a (t), à deux élections différentes sont complètement 
indépendants entre eux, ou non. 

Enfin, les figures [22] montrent l'effet de l'environnement des n p = 16 communes sur 
une commune centrale, à l'instar de leurs homologues Figs. IH et [T21 Pour mémoire, ces 
dernières laissaient apparaître des régularités aux sous figures, a, e et f. 

Pour terminer, indiquons deux autres menues modifications, et sans amélioration no- 
table pour chacune d'elles. 

Premièrement : faire dépendre la longueur caractéristique, / c , de l'environnement 
géographique autour de la commune a considérée —et non pas lui allouer une valeur 
unique à toutes les communes, comme dans le modèle ci-dessus. Nous avons attribué 
une longueur caractéristique à chaque département, l c — > l c .-^, où D représente la 
distance caractéristique entre communes du département considéré, et (D) la distance 
caractéristique entre communes pour la France métropolitaine entière. Les simulations 
n'ont montré aucun effet notable. 

Deuxièmement, modifier la façon dont décroît la prise en compte du voisinage. Jus- 
qu'ici, cette décroissance était exponentielle (en exp(— ^)). Nous avons pris une autre 

forme, assez naturelle aussi : exp(— 2 ^ „ ). Les simulations ont montré un moins bon ac- 
cord avec les données, i.e. une forme des corrélations spatiales qui s'écarte davantage de 
la forme quasi-logarithmique que celle obtenue avec le modèle utilisé jusqu'alors 

3.6.7 Bilan 

En résumé, ce modèle à un paramètre pertinent s'accorde relativement bien aux 
données. Assez correctement, certes, mais pas complètement. 

Même si nous ne pouvons le valider, à ce stade, il représente une tentative encoura- 
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FlG. 22 — Effet de l'environnement sur le résultat de la commune centrale. Voir Figs. PU et [T2l 
pour une comparaison avec les résultats électoraux et les taux de participation. 



géante. 

Demander de plus, à un modèle à un paramètre pertinent, de contenir l'ensemble 
des caractéristiques et particularités du phénomène électoral, représenterait à nos yeux 
une gageure démesurée. Une gageure, ou plutôt une erreur d'appréciation de ce que peut 
apporter un modèle au phénomène étudié. 

Même si ce modèle procure incontestablement des encouragements ou des satisfac- 
tions, je crois néanmoins que quelque chose —de profond?— lui échappe encore. 

Les réponses que nous venons de porter au modèle des tendances communales dyna- 
miques peuvent maintenant s'étendre directement à la question centrale qui animait tous 
les modèles que nous avons essayés ici. A savoir, une imitation simple et restreinte au 
voisinage, peut-elle rendre compte des phénomènes ? 

Ainsi, au stade du développement des modèles rencontrés ici —tous bâtis sur une imi- 
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tation simple et restreinte au voisinage—, notre réponse à notre question centrale restera 
hélas mitigée. (Une réponse claire, quelle qu'elle soit, aurait été à court terme préférable. 
Préférable à court terme sur le plan scientifique, i.e. avec un point de vue cumulatif.) Bref, 
nous pouvons retenir les deux points suivants. 

- L'hypothèse d'une imitation simple et restreinte au voisinage géographique s'accorde 
assez correctement avec les données. Assez correctement mais pas parfaitement. 

- L'imitation doit alors prendre probablement la forme d'une interaction indirecte et 
via les lieux de résidence. 

Peut-être n'avons nous pas suffisamment bien développé les modèles basés sur cette 
question centrale ? A moins qu'il manque encore un autre ingrédient essentiel à prendre 
en compte? Mais peut-être nous sommes-nous fourvoyés d'emblée dans une mauvaise 
question centrale? Mais quoi qu'il en soit, les résultats obtenus ici —et notamment un 
accord relativement correct entre les données et un modèle à un paramètre pertinent— 
ne peuvent que nous inciter à poursuivre, et à enrichir, la démarche qui a animé tout ce 
travail. 
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4 Conclusion 



A mon avis pourtant, découvrir une chose parmi celles qui n'ont pas été 
trouvées, et qui, une fois trouvée, vaille mieux que si elle n'avait pas 
été découverte, c'est l'ambition et l'œuvre de l'intelligence, comme aussi 
accomplir jusqu'à son terme ce qui était à moitié accompli. 
Corpus hippocratique, Art [38J. 

La conclusion de ce travail tiendra en trois points. Nous récapitulerons, dans un premier 
temps, les principaux résultats dégagés de cette étude. Le fait de se confronter à des 
domaines et à des données, actuellement assez exotiques à la physique, ne peut nous 
laisser indifférent et nous incite à nous questionner. Pour cela, le deuxième point de la 
conclusion explicitera la démarche que nous avons volontairement suivie tout au long de 
ce travail. Enfin, nous ne pouvons nous dérober à de nécessaires remises en cause, et autres 
critiques que cette étude suscite. 

4.1 Bilan 

Nous avons étudié séparément les résultats électoraux de 6 élections aux choix binaires, 
et 12 taux de participation, tous deux pour des élections françaises entre 1992 et 2007, 
de même choix (ou assimilable) à l'échelle nationale. Les données électorales ont été ana- 
lysées à l'échelle de la commune, voire du bureau de vote (avec environ 36000 communes 
et 62000 bureaux de vote pour la France métropolitaine). Nous avons de plus tenu compte 
de leur localisation spatiale, ou plus précisément de la position en coordonnées XY de la 
mairie de chaque commune. Ce sont les seules données non électorales dont nous avons 
tenu compte, ici. 

L'étude des données a dégagé les points essentiels suivants : 

- la distribution des r par commune (ou par bureau de vote) des taux de participation 
semble avoir un caractère permanent d'une élection à l'autre ; 

- l'hétérogénéité locale, <7o, des résultats électoraux ou des taux de participation se 
révèle importante —au regard des régularités temporelles et spatiales, ou en terme 
d'information dite positive ; 

- une commune centrale vote (ou s'abstient) en moyenne comme les communes de son 
environnement (r = tq), et l'écart à son entourage, \t — tq\, augmente en moyenne 
régulièrement avec la dispersion, <7o, des communes de son environnement ; 

- les corrélations spatiales des résultats électoraux (ou des taux d'abstention) sont 
relativement fortes à faible distance (voire au sein des bureaux de vote d'une même 
ville), à longue portée (~ 200 km) et de décroissance spatiale quasi- logarithmique. 

Les résultats électoraux montrent, généralement, de plus fortes corrélations intercom- 
munales que les taux d'abstention. En revanche, les taux d'abstention des communes 
témoignent d'une plus grande permanence des valeurs (à un décalage de la moyenne na- 
tionale près) entre différentes élections. 

Des régularités quantitatives —plus clairement prononcées pour les taux de participation— 
sont ainsi apparues. Et, il est important de le signaler, des régularités indépendantes de 
la nature des élections, ainsi que du résultat (ou du taux de participation) moyen de 
l'élection. 

Nous avons donc fait 3 prédictions quantitatives concernant les taux de participation 
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des européennes de juin 2009. Chacune d'elles a été vérifiée à moins d'un sigma (à moins 
d'un écart-type autour de la moyenne des mesures liées aux élections précédentes). 

De plus, l'étude des régularités a le grand mérite de rendre significatives, les quelques 
irrégularités qui s'en détachent. Or, nous n'avons vu aucune irrégularité surgir —d'un 
contexte de régularités—, ni dans des zones à faible ou moyenne population, ni pour 
les taux de participation. Autrement dit, le surgissement d'irrégularité —au sein des 
régularités ambiantes— traduit l'existence d'un autre, ou d'un plus intense, phénomène, 
appelé ici, faute de mieux, le « fait politique ». Et ledit « fait politique », à l'aune des 
élections étudiées, ne peut alors se manifester que dans des zones à fortes population et 
pour l'expression des votes de certaines élections (et particulièrement ici, le référendum 
de 2005). 

Fort de cette analyse de données, nous avons voulu ensuite retrouver les principaux 
phénomènes à partir des modèles simples et reposant sur une dynamique plausible à 
l'échelle microscopique (ici, un comportement plausible des agents). De plus, partant des 
seules données électorales et de leur localisation spatiale, les modèles que nous utilisons 
se fondent sur une imitation, ou interaction, très simple entre agents voisins. Autrement 
dit nous posons aux données la même question centrale : une interaction simple entre 
agents géographiquement voisins permet-elle de s'accorder aux phénomènes? L'interac- 
tion entre agents n'est alors fonction que de la distance qui sépare leur lieu de résidence, 
et décroît exponentiellement en fonction de cette distance. Nous nous sommes servi du 
modèle RFIM qui, par ailleurs, a pu relativement bien s'accorder à d'autres phénomènes 
sociaux. 

Le premier point fort qui ressort de la confrontation d'un modèle aux données... est une 
réfutation. Nous avons montré l'impossibilité d'utiliser un modèle RFIM basé sur l'imi- 
tation des choix entre agents voisins pour reproduire les phénomènes électoraux. Tout se 
passe comme si, avec ce modèle, la proportion des agents du voisinage ayant fait un choix 
par rapport à l'autre (voter en faveur de l'un des deux candidats de la présidentielle, d'un 
oui ou d'un non lors d'un référendum, participer ou s'abstenir à une élection) n'avait au- 
cun effet notable sur le choix à réaliser par l'agent. Nous avons ensuite laissé en question 
ouverte l'impossibilité pour tout modèle basé sur une simple imitation du choix des agents 
du voisinage (à l'instar d'une interaction ferromagnétique des spins), à pouvoir s'accorder 
avec ces données électorales. 

Parmi les modèles correspondants à notre questionnement central, celui qui s'accorde 
le mieux aux données —mais pas encore complètement— est un modèle de type diffusif, et 
de surcroît à un seul paramètre pertinent (la longueur caractéristique d'atténuation de la 
prise en compte du voisinage). Ce modèle possède trois caractéristiques. Premièrement, 
tout se passe comme si la tendance globale des communes, ou la conviction moyenne 
des agents (fortement apparente à r d'une commune), diffuse. (Dans le modèle à seuil 
utilisé, le choix binaire pris par l'agent résulte de la position par rapport à un seuil de 
sa tendance, ou de sa conviction —une grandeur à une dimension réelle et non bornée.) 
Deuxièmement, les spécificités propres aux communes (l'équivalent des sources internes de 
chaleur dans un modèle de diffusion thermique) fluctuent sans corrélation et sans mémoire. 
Enfin, troisièmement, l'intensité de l'interaction entre deux communes voisines ne dépend 
pas de leur nombre d'habitants. Elle ne dépend ici que de la distance qui les sépare. Ceci 
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nous permet de privilégier l'interpétation d'une interaction indirecte des agents (via les 
tendances des lieux où ils résident), au détriment d'une interaction directe entre agents 
(via leur conviction). 

4.2 Démarche adoptée 

« Ce que la physique peut apporter aux sciences sociales, c'est sa démarche expérimentale » [HS] 
déclare Bertrand Roehner —qui le met en application, notamment dans Eî]- (A ce 
sujet, les deux thèses [SU [70], ne manquent pas non plus d'intérêt.) 

J'aurai tendance à adhérer à cette position, bien qu'à mon grand dam je ne connaisse 
pas encore suffisamment les sciences sociales. Je dévierai donc la discussion des sciences 
sociales, aux phénomènes sociaux. 

Cette thèse n'est pas à proprement parler une thèse expérimentale. En revanche, elle 
se contraint d'adopter la rigueur de la méthodologie scientifique, et celle de la physique en 
particulier. Cette démarche semble d'autant plus impérative que les données manipulées 
et les thèmes abordés s'écartent des objets et concepts usuellement traités en physique. 
Revenons donc succinctement sur la démarche ici suivie. 

Les grandeurs électorales, spatialement localisées, ont ainsi été considérées et ma- 
nipulées à l'instar de toutes autres grandeurs physiques mesurables. Peu importe donc 
qu'elles proviennent de l'activité humaine, aussi diverse et variée soit-elle. Plus important 
encore, les données électorales se sont départies de toute une quantité de « détails » et 
d'interprétations. Des « détails » liés au contexte social, politique et historique dans le- 
quel se produit une élection, ainsi qu'aux candidats, partis politiques, etc., engagés dans 
l'élection, et, enfin, au comportement d'un même électeur à différentes élections. Nous 
pensions, par ce biais, atteindre plus facilement des régularités et des caractéristiques du 
phénomène électoral. En un mot, nous nous sommes efforcés à la simplicité. 

Nous reconnaissons en revanche l'aspect limité et restreint de cette étude. La prise en 
compte des données non électorales (de type sociale, économique, politique, historique, 
etc.) pourraient, et devraient, enrichir ce travail. Et plus important encore, nous recon- 
naissons le risque qu'occasionnerait la prise en compte des données non électorales : la 
réfutation de certains pans de cette étude. (Cf. le « modèle zéro » infirmé par la prise 
en compte de la localisation spatiale des données électorales.) Mais de telles infirmations 
constitueraient-elles véritablement un problème, scientifiquement parlant ? 

Sur un plan théorique, les modèles utilisés ici devaient naturellement s'accorder aux 
données, i.e. aux principaux traits dégagés de l'étude empirique des données. Les modèles 
devaient aussi représenter une dynamique plausible à l'échelle microscopique (ici, les 
agents). Ils devaient aussi être simples. Volontairement simples, de manière à ce que 
leurs traits saillants ressortent facilement. Leur confrontation aux données peut alors se 
comprendre comme une question posée aux données. A savoir, ce que disent les données 
sur les points saillants du modèle. 

Précisons néanmoins que l'accord d'un modèle aux données n'exclut pas nécessairement 
d'autres approches possibles. De plus, une recherche empirique des régularités ne s'établit 
pas ex nihilo. Elle sous-tend nécessairement, et en filigrane, des idées —même vagues— 
sous-jacentes. Ici, nous avons été guidé par la recherche d'une relation entre une commune 
centrale et son environnement, et, de façon plus large, par la volonté de comprendre ce 
que traduit, et ce qu'induit, l'environnement d'une commune. 
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On peut être surpris de constater ici à quel point la volonté de simplicité prédomine 
tout au long de ce travail, tant sur son volet empirique que théorique. La réponse — pour 
une fois— est peut-être claire. C'est l'un des moyens, coutumier à la science, d'acquérir 
une emprise sur les phénomènes étudiés. 

4.3 Critique 

La science part, usuellement, des phénomènes les plus simples pour aller aux phénomènes 
plus compliqués, ou plus complexes. Or, ici, on pourrait être surpris d'avoir mis sur un 
plan d'égalité les phénomènes liés aux résultats électoraux et ceux associés aux taux de 
participation. Ces derniers témoignent en effet, sans conteste, d'une plus grande régularité. 
On pourrait donc s'étonner de n'avoir pas commencé l'étude des données électorales par 
les taux de participation, et de n'avoir pas élaboré un modèle qui se préoccupe des seules 
données relatives à l'abstention. 

La critique est valable. Je n'ai rien à y redire, si ce n'est quelques précisions supplémentaires. 

Le grand mérite de l'étude des résultats électoraux est d'avoir, d'emblée, discerné 
l'importance de a (l'hétérogénéité des résultats électoraux, ou des taux d'abstention, dans 
l'environnement autour d'une commune centrale). En commençant l'étude des données 
par l'abstention, l'importance de <To ne se serait pas détachée aussi nettement, et serait 
apparue au sein d'autres régularités, notamment celles liées à la variation du taux de 
participation en fonction de la population de la commune. 

Quant aux modèles, j'ai cru —et continue à le croire— que l'élément clé est la simila- 
rité, d'une élection à l'autre, de la distribution du taux de participation r sur l'ensemble 
des communes. De par son importance même, cet élément devrait constituer le point de 
départ de toute modélisation des phénomènes électoraux (en France). La distribution des 
taux de participation r, et plus particulièrement sa dissymétrie (skewness), provient très 
probablement de la décroissance de la participation à une élection quand le nombre d'ha- 
bitants de la commune augmente. J'ai essayé de partir de ce point de départ (un taux 
d'abstention qui n'est fonction, à un bruit près, que de la population de la commune, et 
notamment une décroissance en fonction de l/ \J Ni nsc , cf. aussi les formes des corrélations 
spatiales de 1/\J N insc et de vr insCi0 comparées à celles de r et de ro), y ai passé du temps, 
et n'ai pas réussi. 

La science, habituellement, se construit en se basant sur les connaissances précédentes 
—et ce, de manière cumulative, ou au contraire, parfois, sous forme de rupture. Bref, la 
physique n'a pas pour vocation de réinventer l'eau chaude, ni de retrouver des bribes 
d'un autre savoir déjà bien constitué. Pourtant, ici, on pourrait constater qu'il n'a été fait 
mention des sciences sociales qu'avec très grande parcimonie. On devrait donc trouver 
risible, pour le moins, que cette étude réalisée sur les données électorales se soit construite 
presque indépendamment des sciences sociales. 

La critique est de nouveau valable. Elle appelle néanmoins à de nouvelles remarques, 
en plus de l'avertissement initial mis en introduction. 

Je ne veux pas rentrer dans le débat concernant l'inutilité, à court terme, de la re- 
cherche scientifique —en me référant notamment, à la fulgurante progression des « sciences » 
grecques comparées aux « sciences » millénaires égyptiennes et mésopotamiennes [55], ou 
bien à l'importance historique de la chute des corps dans l'élaboration de la science mo- 
derne. Bref, je ne parle pas ici de l'intérêt pratique de ce travail, mais du manque apparent 
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d'intérêt à retrouver par la physique ce que les sciences sociales auraient préalablement 
établi. On pourrait alors considérer ce travail comme un jeu stérile, une pure perte de 
temps. Peut-être. Mais ce serait méconnaître l'enrichissement que peut procurer la diver- 
sité des angles de vues. (Mais vouloir multiplier sans arrêt les approches, ne présente guère 
d'intérêt non plus.) Il serait maintenant enrichissant de se confronter aux sciences sociales. 
Des points soulevés dans ce travail, lesquels ont été déjà trouvés, lesquels éventuellement 
entrent en contradiction, lesquels sont suraccentués, sous-accentués, etc. ? Bref, par la 
comparaison, par le décalage, produits par des voies d'investigations différentes, ce travail 
devrait probablement donner du relief à l'objet étudié ici (les données électorales). Mais 
cette comparaison, ce décalage, nécessitent préalablement des études menées quasiment 
indépendamment l'une de l'autre. 

D'autre part, je me laisserais porter à croire qu'une problématique exclusivement phy- 
sique de cette étude présente un avantage supplémentaire. (Il existe bien évidemment, 
bien d'autres questionnements possibles, et purement physiques.) Ce travail s'est efforcé 
de rendre explicite la problématique, le parti pris, dans lesquel il s'est engagé. Or, plutôt 
que de s'embarquer directement avec ses propres outils sur la problématique d'une autre 
discipline, un véritable travail pluridisciplinaire gagne, me semble-t-il, à s'appuyer sur 
différentes problématiques clairement identifiées. (Mais vouloir multiplier indéfiniment 
les problématiques, ne présente guère d'intérêt non plus.) La rencontre de plusieurs 
problématiques, indépendantes entre elles, sur le même objet d'étude pourrait —du moins, 
espérons-le— s'avérer fécond. Il serait maintenant enrichissant de mieux connaître les 
problématiques et les outils issus des sciences sociales en vue de poursuivre ce travail. 
Puisse donc cette étude de physique faciliter et participer à une construction plus large à 
venir. 

La science, aux dires de certains, serait une insatisfaction permanente et structurée. 
Les phénomènes sociaux ont été étudiés ici, avec une démarche entièrement issue de la 
physique. On pourrait se gausser à constater que cette étude, au thème exotique, n'ait 
suscité aucun questionnement —hormis raffirmation de se positionner dans une démarche 
purement physique— ni aucune remise en cause. 

La critique est encore valable, et nécessite quelques explications supplémentaires. 

Premièrement, je ne veux pas rentrer dans un débat philosophique sur le politique qui, 
par exemple, le définit comme « un espace entre les hommes », et le conçoit comme le 
« miracle de la liberté » reposant sur l'agir de l'homme et sa capacité à créer un « nou- 
veau commencement »— incalculable donc pj. Le politique n'a pas été étudié ici : seules 
l'ont été les données électorales. Quant à savoir si les phénomènes humains sont, par na- 
ture, complètement séparés des phénomènes naturels —à l'instar des mondes sublunaire 
et supralunaire de la physique aristotélicienne—, je m'en tiendrai à une position naïve. 
Étudions et on verra. Et l'étude ne pourra qu'enrichir chacun des deux domaines si elle 
parvient —ce serait une sorte de Graal— à montrer qu'ils restent distincts (de par l'af- 
firmation de leur distinction), ou à faire naître un monde plus large, englobant les deux 
domaines anciennement distincts. 

Enfin, j'inclinerais à croire que l'étude des phénomènes sociaux représente, pour la 
physique, une chance à saisir. Non seulement pour lui permettre d'affirmer sa démarche 
expérimentale —bien attestée par ailleurs—, ou pour appliquer des outils très —voire 
trop ?— efficaces, comme ceux de la physique statistique. (Des outils trop efficaces dans le 
sens où, grisé par la réussite, ils n'incitent pas au premier abord à une réflexion critique.) 
Mais surtout, pour lui permettre de remettre en cause quelques uns de ses concepts ac- 
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tuels. Je pense notamment au principe de séparabilité, i.e. la possibilité de séparer, de 
distinguer, une grandeur de son environnement, ou de permettre à une grandeur, à un 
objet, une existence isolée. 

Mais avant de penser à un potentiel élargissement, encore fallait-il connaître ce qu'une 
étude classique pouvait dire sur le domaine. Ainsi s'achève cette thèse. 
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A Figures et tables supplémentaires 



I992-b 

-— 1995-b 

2000-b 

2002-b 

■— 2005-b 
2007-b 



— ■ 2000-b 
2002-b 
2005-b 
2007-b 



i '.' 'S W \ 



\ <t f 



/ / 

/ //S 



0,4 0,6 0,8 

P 



0,2 



■-.-rt-rrr- ■ -' 

0,4 0,6 
P 



FlG. A-l — Histogrammes comparables à la Fig. [T]des résultats p = ^- 9ag " . 



Année 


com. 


moy 


éc-typ 


skew 


kurt 


bur. 


moy 


éc-typ 


skew 


kurt 


1992 


36186 


0,461 


0,104 


0,024 


0,524 












1995 


36197 


0,543 


0,118 


0,093 


0,478 












2000 


36202 


0,697 


0,102 


-0,999 


2,80 


62253 


0,713 


0,091 


-1,20 


3,99 


2002 


36215 


0,803 


0,075 


-0,476 


0,728 


62352 


0,811 


0,074 


-0,577 


0,526 


2005 


36220 


0,589 


0,102 


-0,315 


0,447 


62775 


0,569 


0,121 


-0,410 


0,279 


2007 


36219 


0,560 


0,111 


-0,091 


0,455 


63516 


0,543 


0,115 


-0,028 


0,200 



TAB. A-l - Statistiques de Tab.[2]pour les résultats p = 




FlG. A- 2 — Moyenne des résultats r calculés à l'intérieur de 36 intervalles sur N expr ; pour les 
communes à gauche et pour les bureaux de vote à droite. 



20 Le choix des couleurs doit beaucoup à l'ardeur de Hugues Borghesi et de Léna Borghesi, de par 
leurs intenses réflexions, leurs débordements d'imagination, leurs jugements critiques, leurs engouements 
passionnés, etc., et je les en remercie. 
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log 10 (N) n 
FlG. A-3 - Histo grammes pour l'élection 2007-b des nombres d'électeurs inscrits Ninsc 

et de 

suffrages exprimés N expr , par commune à gauche et par bureau de vote à droite. 



a 



,v- 



X (100 m) 



g 

o 
o 



mm 




mm 



FlG. A-4 — Coordonnées XY des communes selon le nombre d'inscrits à l'élection 2007-b, des 
communes (à gauche), ou des bureaux de vote (à droite). Les nombres d'inscrits s'échelonnent 
sur 14 intervalles, partant par ordre croissant du violet jusqu'au noiiP^l, 





FlG. A- 5 - Corrélations spatiales des (à gauche) et des ctq (à droite) des résultats 
électoraux par commune. Le mélange aléatoire des résultats par commune et le « modèle 
zéro » s'appliquent aux données de l'élection 2007-b. 



89 




X (100 m) X (100 m) 

FlG. A- 6 — Coordonnées XY des communes centrales sur lesquelles s'évaluent <Tq des résultats 
de l'élection 2007-b, en fonction des grandeurs par commune (à gauche), ou par bureau de vote 
(à droite). Les valeurs de <7q se répartissent sur 14 intervalles, partant du violet pour les plus 
faibles, jusqu'au noir pour les plus grandes. 




FlG. A- 7 - Histogrammes de Tq, de <Tq et de (r a — Tq) 




(T„ - <T »/A 



°o /<a o> 



FlG. A- 8 — Eventuel lien entre les deux grandeurs caractérisant l'environnement : <7q = /(tq*) 

et r Q = /(°o0- 
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a 



FlG. A-9 - Ecart-type de (r Q - rf) en 
fonction de <Tq , calculé avec 36 intervalles. 
Les simulations (voir texte) en traits ma- 
genta et jaune continus s'établissent à par- 
tir des valeurs réelles de l'élection 2007- 
b. gauss(X) signifie une distribution gaus- 
sienne de moyenne nulle et d'écart-type X. 



U ^\ 


1995 


2000 


2002 


2005 


2007 


1992 


-0,189 


0,347 


0,318 


-0,353 


-0,180 


1995 




-0,290 


-0,037 


-0,516 


0,734 


2000 






0,253 


-0,028 


-0,329 


2002 








-0,308 


-0,339 


2005 










-0,417 



TAB. A- 2 — Corrélation tempo- 
relle Ct^t- (r) des r a sur chaque 
couple d'élections (ti,tj). Pour 
les valeurs absolues : moyenne 
Ct(r) = 0,309; écart-type 



k [Ct(T)] 



0, 175 ; 



Ct(r) 



0, 564. 



\^ tj 
u \^ 


1995 


2000 


2002 


2005 


2007 


1992 


-0,075 


0,574 


0,367 


-0,535 


-0,109 


1995 




-0,421 


-0,069 


-0,644 


0,795 


2000 






0,487 


-0,084 


-0,525 


2002 








-0,311 


-0,533 


2005 










-0,458 



TAB. A-3 Corrélation tem- 
porelle C tu tj(ro) des Tq sur 
chaque couple d'élections (ti,tj). 
Pour le valeurs absolues : 
moyenne Ct(ro) = 0,399; 



écart-type A 



[Ct(ro)] 



0,226 



^gf(TQ)] 

Ct(r Q ) 



0, 567. 




N. /n N. /n 

insc, cour p insc, cour p 

FlG. A- 10 — Le nombre d'inscrits N^ sc par commune centrale a, en fonction de l'ensemble 
des inscrits, N^ sc cour , dans les n p communes de son environnement (cf. Eq. ([9])). Le calcul des 
écarts-types relatifs, qui indique l'intensité de la polarisation, s'effectue à partir de log(A^j nsc ) 
afin d'éluder les problèmes liés aux lois de puissance. 
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FlG. A- 11 Corrélations spatiales de 
Vinsc, o et de -, 1 , correspondants à 

V 'irise 

l'élection 2007-b. Noter la ressemblance 
—peut-être fortuite ?— des corrélations 



spatiales de 



avec celles des résultats 



électoraux r (excepté ceux de l'élection 
de 2000) et, à un bruit supplémentaire 
près, celles des taux de participation (cf. 
Figs. [ÏÏIet lll|) . Noter aussi la similarité des 
corrélations spatiales de ~ïïi n sc,o avec celles 
des Tq des résultats électoraux, et plus 
particulièrement encore avec celles des Tq 
des taux de participation (cf. Figs. IA-51 et 

E3H). 
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Élection 


com. 


moy 


éc-typ 


skew 


kurt 


bur. 


moy 


éc-typ 


skew 


kurt 


1992-b 


36186 


0,750 


0,061 


-0,148 


1,20 












1994-m 


36196 


0,585 


0,087 


0,254 


1,57 












1995-m 


36195 


0,827 


0,050 


-0,841 


6,60 












1995-b 


36197 


0,842 


0,047 


-0,229 


1,70 












1999-m 


36209 


0,534 


0,090 


0,565 


1,07 


62005 


0,507 


0,090 


0,558 


1,27 


2000-b 


36212 


0,352 


0,083 


1,082 


3,34 


62267 


0,330 


0,081 


1,06 


3,66 


2002-m 


36217 


0,770 


0,056 


-0,255 


2,64 


62356 


0,745 


0,065 


-0,359 


1,63 


2002-b 


36217 


0,837 


0,045 


-0,296 


1,28 


62358 


0,820 


0,052 


-0,628 


2,67 


2004-m 


36221 


0,476 


0,086 


0,870 


1,88 


62775 


0,455 


0,085 


0,669 


1,94 


2005-b 


36223 


0,750 


0,059 


0,004 


0,93 


62778 


0,727 


0,069 


-0,452 


1,34 


2007-m 


36219 


0,873 


0,040 


-0,768 


7,51 


63514 


0,861 


0,046 


-0,844 


3,79 


2007-b 


36219 


0,874 


0,039 


-0,397 


1,39 


63516 


0,862 


0,044 


-0,633 


1,70 



TAB. A-4 — Statistiques de Tab. [7] pour les taux de participation p = M vot . 

-''znsc 



• 1992-b 

■ 1994-m 
- 1995-m 

■ 1995-b 

■ 1999-m 

■ 2000-b 
2002-m 
2002-b 

• 2004-m 
2005-b 
2007-m 
2007-b 



n 



ÎVI M 



/■ y m 



0,2 











bur. 


1 


1 






• 1999-m 
















«— 2000-b 
















■ • 2002-m 
















— - 2002-b 
















• • 2004-m 
















2005-b 
















2007-m 










r'I: i 






2007-b 




































\ • 
ï 












/ 










* l \\ \ 






/ 
























-'-+ '-- 1 


, , . . 1 





FlG. A-12 — Histogrammes comparables à la Fig. [8] des taux de participation p 



N vot 



h ni". 




FlG. A- 13 — Moyenne des taux de participation r calculés à l'intérieur de 36 intervalles sur 
Ni nS c ; pour les communes à gauche et pour les bureaux de vote à droite. 
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U 0,4 



0,2 - 




— mélange 
modèle /.èvo 




FlG. A- 14 - Corrélations spatiales des Tq (à gauche) et des (à droite) des taux de 
participation par commune. Le mélange aléatoire des résultats par commune et le « modèle 
zéro » s'appliquent aux données de l'élection 2007-b. 




bur. 



5000 

X (100 m) 



25000 - 



o 
o 



' air 



5000 

X (100 m) 



i " 



FlG. A- 15 — Coordonnées XY des communes centrales sur lesquelles s'évaluent o"q des taux de 
participation de l'élection 2007-b, en fonction des grandeurs par commune (à gauche), ou par 
bureau de vote (à droite). Les valeurs de (Tg se distribuent sur 14 intervalles, partant du violet 
pour les plus faibles, jusqu'au noir pour les plus grandes. 



1 


1 i 














0,5 
a 




FlG. A-16 - Histogrammes de Tq , de <Tq et de (r a — Tq) des taux de participation. 
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-10 1 

(T - <x »/A 
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FlG. A-17 — Eventuel lien entre les deux grandeurs caractérisant l'environnement : 0"q = /(tq) 
etr Q = /K). 



U ^\ 


94-m 


95-m 


95-b 


99-m 


00-b 


02-m 


02-b 


04-m 


05-b 


07-m 


07-b 


1992-b 


0,601 


0,585 


0,570 


0,513 


0,453 


0,458 


0,442 


0,405 


0,457 


0,363 


0,369 


1994-m 




0,549 


0,578 


0,663 


0,576 


0,487 


0,439 


0,562 


0,488 


0,345 


0,373 


1995-m 






0,740 


0,471 


0,395 


0,523 


0,488 


0,347 


0,442 


0,408 


0,410 


1995-b 








0,549 


0,453 


0,505 


0,500 


0,447 


0,462 


0,398 


0,441 


1999-m 










0,687 


0,562 


0,506 


0,700 


0,574 


0,400 


0,444 


2000-b 












0,485 


0,451 


0,628 


0,496 


0,351 


0,387 


2002-m 














0,736 


0,525 


0,595 


0,510 


0,527 


2002-b 
















0,479 


0,575 


0,531 


0,549 


2004-m 


















0,640 


0,434 


0,477 


2005-b 




















0,595 


0,607 


2007-m 






















0,764 



TAB. A- 5 — Taux de participation : corrélation temporelle Ct it tj( T ) des r a sur chaque couple 
d'élections fatj). Moyenne C t (r) = 0,507; écart-type A[ Ct(r)] = 0,099 ; ^rry = 0,200. 



\. tj 

U ^\ 


94-m 


95-m 


95-b 


99-m 


00-b 


02-m 


02-b 


04-m 


05-b 


07-m 


07-b 


1992-b 


0,733 


0,748 


0,705 


0,654 


0,656 


0,649 


0,631 


0,473 


0,679 


0,486 


0,526 


1994-m 




0,636 


0,724 


0,805 


0,745 


0,639 


0,590 


0,693 


0,697 


0,431 


0,529 


1995-m 






0,806 


0,545 


0,522 


0,773 


0,712 


0,380 


0,618 


0,560 


0,585 


1995-b 








0,747 


0,680 


0,734 


0,750 


0,651 


0,715 


0,572 


0,681 


1999-m 










0,828 


0,673 


0,645 


0,854 


0,772 


0,485 


0,620 


2000-b 












0,601 


0,594 


0,770 


0,699 


0,436 


0,548 


2002-m 














0,826 


0,593 


0,762 


0,604 


0,706 


2002-b 
















0,598 


0,767 


0,755 


0,806 


2004-m 


















0,759 


0,486 


0,630 


2005-b 




















0,696 


0,784 


2007-m 






















0,857 



TAB. A-6 - Taux de participation : corrélation temporelle C^f . (to) des Tq sur chaque couple 
d'élections (*», tj). Moyenne C t (r ) = 0, 661 ; écart-type A [Ct(ro)] = 0, 110 ; ^§Pf- = 0, 167. 
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B Taux de croissance de population et hétérogénéité 
locale <7o 

Cette annexe esquisse une façon de mesurer la présence éventuelle d'une grandeur, 
d'une information, dans ctq, lorsque cette grandeur s'évalue sur la même zone géographique 
que a . Ici, a peut aussi bien se calculer à partir des données par commune que par bureau 
de vote, et concerne soit des résultats d'élections, soit des taux de participation. 

Cette annexe se consacre à la connexion entr'aperçue précédemment (voir section l2.1.8l 
et Tab. I3J entre les différents <To de l'élection de 2007-b et le taux d'augmentation de popu- 
lation entre 1992 et 2007. (Remarque au passage : n'ayant aucune certitude concernant le 
sens de la causalité entre a et le taux d'augmentation de population, ou de leur éventuelle 
rétroaction, nous préférons employer les termes de connexion, ou de présence, plutôt que 
celui d'influence. Ces deux premiers termes se mesurent d'ailleurs correctement par des 
coefficients de corrélation, sans oublier l'adage bien connu « corrélation ne fait pas causa- 
lité ».) 

Précisons les grandeurs utilisées pour décrire le taux d'augmentation de population 
dans la zone géographique, V" 6 , d'évaluation de cxo- De nouveau, la population se réduit et 
se mesure, ici, par le nombre de personnes inscrites sur les listes électorales des communes 
ou des bureaux de vote. Les données électorales que nous possédons s'échelonnent entre 
1992 et 2007, ce qui incite à définir le taux d'augmentation de population sur le plus large 
intervalle possible, soit ici entre 1992 et 2007. N'ayant pas la connaissance des données 
par bureau de vote de l'année 1992, nous ne pouvons accéder qu'au taux d'augmentation 
de population par commune. Notons comme à la section 12.1.81 

p „ = lll( A^(2007) (B-l) 

le taux d'augmentation de population de la commune a. Sur l'environnement V" 6 autour 
de la commune centrale a, le taux d'augmentation de population peut alors se déterminer 
comme 

1 £ / , (B-2) 



PÔ 



n v 
p Pev& 



ou comme 



p ~- to ^<W' (B " 3) 

où (3 désigne l'une des n p = 16 plus proches communes de a. 

La grandeur p$, non pondérée par la taille de la population, offre plus de compatibi- 
lité avec <7q (grandeur non pondérée avec la population), que p^ OUT avec ctq. Par contre, 
la grandeur p^ our s'accorde aussi bien à un traitement des données par commune que par 
bureau de vote, tandis que p% se restreint à celui des communes. En résumé, p$ et p% ur 
définissent ici le taux d'augmentation de population dans la zone géographique de Œq ; 
avec une prédilection pour p$ s'il s'agit de travailler avec <Tq calculé à l'aide des résultats 
électoraux (ou des taux de participation) par commune, et p% ur -, faute de mieux, si <Jq se 
détermine avec des données par bureau de vote. 

Chercher la présence de p$ (ou de Pç 0ur ) dans ctq par une simple corrélation —comme 
nous l'avions fait entre p a et ctq à la section 12.1.81 et notamment à la table Hl— ne suffit 
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pas. En effet, la taille de la population se connecte à la fois avec <Tq et avec le taux d'aug- 
mentation de la population. Une corrélation entre <Tq et p% (ou p" 0îtr ) ne signifie pas alors 
nécessairement que le taux d'augmentation de population se relie directement à a . Par 
exemple, la corrélation sur l'ensemble des communes de X a = Uq des résultats par com- 
mune de 2007-b et de Y a = 7rf nsc (cf. Eq. (HÔD) vaut C X y ^ 0, 66 (voir Tab. E> ; et pour 
X a = p% et Y a = itf nsc , Cxy — —0, 51 (i.e. en moyenne, plus la population augmente, 
plus le taux de croissance de population, augmente aussi). La corrélation Cxy — —0,42 
entre X a = <Tq et Y a = p$ ne permet pas alors d'affirmer une connexion directe entre ces 
deux dernières grandeurs, du fait de leur connexion commune avec n" nsc . 

Nous devons donc avoir recours à une régression multiple, entre d'un côté erg , et d'autre 
côté Tr? nsc g et p% (ou Pc 0ur )- De plus, pour des raisons de simplicité et de cohérence par 
rapport aux corrélations calculées dans le corps du texte, nous utiliserons une régression 
linéair^j]. Ainsi, après avoir centré et réduit <Tq, vr° lsc et p$ (ou Pc 0ur ), nous pouvons 
déterminer par régression les paramètres estimer, C n et C p , tels que : 

~< = CA C>0 + C v .p% + e a . (B-4) 

(X désigne une variable X de moyenne nulle et de variance unité. p" our pourra remplacer p$ 
dans l'équation ci-dessus.) Le paramètre recherché, C p , mesure la relation linéaire entre <Tq 
et le taux d'augmentation de population, p$ (ou Pç 0ur ), non entachée de relation indirecte 
à la taille de la population —caractérisée ici par 7if nsc . De même, C n exprime une relation 
linéaire entre ir? nsc et ctq , dégagée d'une relation indirecte avec le taux d'augmentation 
de population— mesuré par p% ou Pc 0ur - 

La qualité de la régression se retrouve dans le coefficient de corrélation multiple, R, 
écrit ici comme 



R=\ll- L (B-5) 

V n 

où n désigne le nombre de communes centrales a prises en compte. Plus R se rapproche 
de 1, plus la pertinence de la régression linéaire, entre d'une part <Tq et d'autre part 7T^ nsc 
et p% (oup^ our ), s'accroît. 

La table IB-ll fournit les paramètres estimés, CV et C p ainsi que le coefficient de 
corrélation multiple R pour les erg de l'élection 2007-b. (Tq et ^tnsc o s'appliquent de façon 
concomitante sur les mêmes types de données : celles issues des bureaux de vote ou bien 
celles issues des communes. Lorsque dérive des résultats électoraux (ou des taux de 
participation) des bureaux de vote, irf n sc provient à son tour du nombre d'inscrits de ces 
bureaux de vote. Par contre, si o"q découle des résultats électoraux (ou des taux de partici- 
pation) par communes, itf nsc se calcule aussi à partir du nombre d'inscrits par commune. 
Rappelons que 7r^ sc se réfère ici aux inscrits de l'élection 2007-b. Remarque : le taux 
d'augmentation de population exprimé par p° our s'applique à la fois, avec <Tq calculé via 
les données des bureaux de vote, et via celles des communes, afin de mieux comparer la 
régression linéaire appliquée à ces deux échelles de mesures différentes. 

Par la suite, quand Uq s'évaluera à l'aide des données issues des communes, le taux 
d'accroissement de population sur la zone géographique correspondante s'estimera unique- 
ment par Pq . Par contre, si ctq s'évaluera à l'aide des données issues des bureaux bureaux 
de vote, p% ur mesurera le taux d'augmentation de population correspondant. 



e cx\2 



21 L'idée d'une régression linéaire multiple entre ctq , une grandeur liée à la population et une autre au 
taux de croissance de population revient entièrement à Jean-Philippe Bouchaud. 
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C n 


C p 


R 


Résultats : 


(Jq par com. et Pq 


0,608 


-0,109 


0,67 




a% par com. et p a cour 


0,621 


-0,099 


0,67 




ag par bur. et p° our 


0,554 


-0,110 


0,61 


Taux de participation : 


Uq par com. et p$ 


0,707 


+0,085 


0,67 




°q par com. et p a cour 


0,681 


+0,042 


0,66 




o% par bur. et p a cour 


0,644 


+0,036 


0,63 



TAB. B-l - Paramètres C n , C p , et le coefficient R pour différents <Tq de l'élection 2007-b. Pour 
mémoire, la corrélation C CT7r entre Ctq et iïf nsc (voir Tabs. \5\ et [9]) vaut, pour les résultats : 
Caw — 0, 66 à l'échelle des communes, C ait ~ 0, 60 à l'échelle des bureaux de vote ; et pour 
les taux de participation : C CT7r ~ 0, 66 à l'échelle des communes, C aiv ~ 0, 63 à l'échelle des 
bureaux de vote. Par comparaison, pour un tirage binomial de probabilité p par commune, ou 
par bureau de vote, avec les données des résultats de l'élection 2007-b : ctq ~ 0, 85wf nsc (i.e. 
R = C a7T ~ 0,85). 

Interprétons succinctement la table IB-1[ en s'aidant des corrélations C an entre (Jq et 
^Tnsc o auxquelles elle se rapporte. Premièrement, le taux de croissance de population, 
sans sa connexion à la taille de la population, ou plus précisément ici à ir™ nsc , contribue 
faiblement à expliquer erg . En effet, C n dépasse de beaucoup C p en valeur absolue. De 
plus, le coefficient de corrélation multiple R n'augmente que très faiblement la corrélation 
simple C an entre erg et Trf nsc . Ceci confirme la prédominance de irf nsc , comparée à p$ 
(ou à pZour)i dans ctq. Deuxièmement, l'échelle de mesure des bureaux de vote pour les 
(Jq et les itf nsc q ne modifie que légèrement l'analyse effectuée à l'échelle des communes. 
Enfin, la connexion entre le taux de croissance de la population et Ctq , diffère selon que Uq 
se réfère aux résultats ou aux taux de participation. Cette connexion, mesurée ici par Cp, 
prend une valeur petite et positive pour les taux de participation, et signifie par là même 
une légère augmentation de la dispersion des taux de participation à l'intérieur d'une 
zone à forte augmentation de population. Par contre, pour les résultats électoraux, C p a 
une valeur négative et en valeur absolue supérieure à celle des taux de participation. Ce 
qui s'interprète selon les deux points suivants : d'une part, la connexion entre <Tq et taux 
d'augmentation de population se marque davantage pour les résultats électoraux que pour 
les taux de participation, et, d'autre part, en moyenne plus une zone géographique connaît 
une forte augmentation de population, plus l'hétérogénéité des résultats à l'intérieur de 
cette zone diminue. Voilà ce qui constitue à nos yeux l'enseignement majeur de l'analyse 
faite ci-dessus recherchant la présence du taux d'augmentation de la population dans les 
divers cXq de l'élection 2007-b. 

Mais nous pouvons encore enrichir cette étude. Tout d'abord, à titre anecdotique, la 
table IB-21 fournit les paramètres C n , C p et R, non plus sur toutes les communes centrales 
a de la France métropolitaine comme à la table EU mais pour chacune des 21 régions 
métropolitaines. En termes de résultats électoraux, la région Ile-de-France dépareille des 
autres régions. Ceci nous pousse tout naturellement à savoir comment les coefficients C n , 
C p et R, varient en fonction du nombre d'inscrit N^ nsc cour (cf Eq. ©) à l'intérieur de Vf 6 , 
et ce indépendamment de la localisation de la commune centrale a. 

Et puisque nous nous posons ce genre de question, voyons aussi comment ces trois 
coefficients varient en fonction du résultat électoral (ou du taux de participation) global 
à l'intérieur de Vf 6 , et de nouveau pour l'ensemble des communes métropolitaines. Le 
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résultat global, r^ our , à l'intérieur de V" 6 , se détermine à l'instar de r a (voir Eq. [2]) comme 



Le nombre de suffrages exprimés N expr et de suffrages N gagn en faveur du choix gagnant à 
l'échelle nationale concernent évidemment ceux de l'élection 2007-b. Pour évaluer le taux 
de participation global r" our sur cette zone, il suffit de remplacer N expr par le nombre de 
personnes inscrites N insc , et N gagn par le nombre de participants N vot . Notons que r" our , 
comme vZouri s'applique indifféremment à une analyse à l'échelle des bureaux de vote 
ou à l'échelle des communes. Les figures lËTTl tracent C n , C p et R sur 36 échantillons en 

■^insc.cour OU en T~cour- 

Terminons cette analyse en commentant succinctement les figures IB-ll La première 
déduction tirée de ces figures se rapporte à la variation des paramètres C p , C n et R, essen- 
tiellement sur les zones à forte population N^ nsc cour . La plus grande modification concerne 
les taux de participation, mais les résultats électoraux. Interpréter les valeurs de ces trois 
coefficients, pour les résultats électoraux, et pour l'échantillon de la plus forte population, 
se révèle d'autant plus périlleux que C n et C p diffèrent selon l'échelle de mesure, i.e. selon 
que (Tq se calcule à partir des résultats électoraux des communes ou des bureaux de vote. 
Notons toutefois que <Tq des résultats électoraux croît quand N" nsc cour augmente pour les 
zones à forte population (cf. Fig. [6]). Le second résultat —fort, celui-ci— qui découle des 
figures |B7Ï| concerne l'indépendance des paramètres C n , C p et R en fonction du résultat 
électoral (ou du taux de participation) global sur la zone d'évaluation de <Tq . Autrement 
dit le fait qu'une zone vote plus ou moins pour un candidat (ou participe plus ou moins à 
l'élection) n'a aucun lien, en moyenne, sur la présence du taux de population et de iT? nsc 



Nous avons voulu présenter dans cette annexe des méthodes pour extirper de l'in- 
formation dans <Tq. En s'attaquant à d'autres données, autres que celle dont nous dis- 
posions —du taux d'augmentation de population, qui fournit, admettons-le, relativement 
peu d'information— peut-être obtiendrait-on plus de renseignement ? 




(B-6) 



dans al 
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Régions 


com. Cjr 


r < 


K 


bur. 




/■ 1 

Op 


K 


Alsace 


0,42 


-0,25 


0,53 




0,16 


-0,33 


0,38 


Aquitaine 


0,63 


-0,00 


0,64 




0,58 


+0,04 


0,55 


Auvergne 


0,53 


-0,22 


0,70 




0,63 


-0,13 


0,70 


Bourgogne 


0,56 


-0,19 


0,68 




0,49 


-0,23 


0,62 


Bretagne 


0,26 


-0,22 


0,43 




0,08 


-0,16 


0,21 


Centre 


0,57 


+0,01 


0,56 




0,33 


-0,11 


0,38 


Champagne- Ardenne 


0,55 


-0,05 


0,58 




0,64 


+0,07 


0,61 


Franche-Comté 


0,62 


-0,12 


0,69 




0,56 


-0,17 


0,64 


Ile-de-France 


-0,09 


-0,34 


0,37 




-0,25 


-0,36 


0,47 


Languedoc- Roussillon 


0,66 


-0,19 


0,81 




0,63 


-0,21 


0,78 


Limousin 


0,72 


+0,07 


0,68 




0,64 


+0,05 


0,61 


Lorraine 


0,61 


-0,11 


0,67 




0,60 


-0,18 


0,67 


Midi-Pyrénées 


0,65 


-0,14 


0,73 




0,66 


-0,16 


0,75 


Nord-Pas-de-Calais 


0,44 


-0,14 


0,51 




0,26 


-0,21 


0,37 


Basse-Normandie 


0,49 


-0,09 


0,54 




0,34 


-0,16 


0,42 


Haute- Normandie 


0,27 


-0,24 


0,41 




0,12 


-0,32 


0,35 


Pays de la Loire 


0,42 


-0,08 


0,47 




0,21 


-0,15 


0,32 


Picardie 


0,39 


-0,34 


0,59 




0,30 


-0,34 


0,50 


Poitou-Charentes 


0,45 


-0,28 


0,69 




0,36 


-0,25 


0,56 


Provence-Alpes-Côte d'azur 


0,71 


+0,01 


0,70 




0,56 


-0,15 


0,64 


Rhône- Alpes 


0,57 


-0,21 


0,72 




0,51 


-0,20 


0,63 


— ~~-JIaux de participation 
Régions — _______ 


com. Gjr 




K 


bur. 


r 1 

w 


r r 
O p 


K 


Alsace 


0,37 


+0,26 


0,41 




0,23 


-0,01 


0,23 


Aquitaine 


0,45 


-0,08 


0,51 




0,39 


-0,17 


0,51 


Auvergne 


0,58 


+0,01 


0,57 




0,48 


+0,03 


0,46 


Bourgogne 


0,59 


+0,03 


0,57 




0,51 


-0,02 


0,52 


Bretagne 


0,39 


+0,06 


0,36 




-0,05 


-0,13 


0,12 


Centre 


0,63 


+0,15 


0,58 




0,44 


-0,04 


0,45 


Champagne- Ardenne 


0,65 


+0,30 


0,49 




0,51 


+0,14 


0,46 


Franche-Comté 


0,59 


+0,04 


0,57 




0,55 


-0,04 


0,57 


Ile-de-France 


0,65 


+0,00 


0,65 




0,53 


+0,01 


0,53 


L anguedo c- Roussillon 


0,83 


+0,08 


0,77 




0,73 


+0,04 


0,71 


Limousin 


0,62 


+0,21 


0,52 




0,48 


+0,22 


0,38 


Lorraine 


0,67 


+0,03 


0,66 




0,63 


-0,02 


0,64 


Midi-Pyrénées 


0,75 


+0,14 


0,69 




0,68 


+0,07 


0,65 


Nord-Pas-de-Calais 


0,53 


-0,06 


0,56 




0,47 


-0,15 


0,53 


Basse-Normandie 


0,66 


+0,22 


0,58 




0,48 


+0,03 


0,47 


Haute- Normandie 


0,36 


-0,10 


0,40 




0,33 


-0,10 


0,35 


Pays de la Loire 


0,76 


+0,14 


0,68 




0,50 


-0,06 


0,54 


Picardie 


0,52 


-0,03 


0,53 




0,49 


-0,04 


0,50 


Poitou-Charentes 


0,45 


-0,08 


0,52 




0,26 


-0,17 


0,40 


Provence-Alpes-Côte d'azur 


0,59 


+0,08 


0,54 




0,66 


+0,10 


0,63 


Rhône- Alpes 


0,73 


+0,02 


0,72 




0,63 


-0,06 


0,66 



TAB. B-2 - Paramètres C n , C p et le coefficient R par région, pour les résultats (en haut) et pour 
les taux de participation (en bas) de l'élection 2007-b ; avec <Tq évalué à partir des communes 
(com.) et Pq , ou bien à partir des bureaux de fQpP (bur.) et p" OU r- 






Taux de participation 





FlG. B-l - Paramètres CV, C p et le coefficient R pour les résultats (à gauche) et pour les taux de 
participation (à droite) de l'élection 2007-b, calculés à l'intérieur de 36 échantillons en N^ lsc cour 
(en haut) et en T cour (en bas). Gq calculé à l'aide des données par commune (com.) utilise pfi, 
et à l'aide des données par bureau de vote (bur.), Pc OUT - 
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C L'hétérogénéité locale cfq et l'information locale 
dite positive 

Cette annexe s'attache à déceler la trace présente dans ctq , d'une information locale, 
permanente et non entachée de bruit dû aux tailles finies. 

Dans un premier temps, nous essaierons de mesurer —y compris a minima— dans 
quelle proportion cette partie pérenne intervient dans la permanence globale de ctq à 
diverses élections. Ensuite, nous appréhenderons cette partie pérenne par l'intermédiaire 
des corrélations inter-communales, que nous tenterons indirectement de mesurer. Nous 
localiserons ensuite les zones à plus ou moins forte partie pérenne. Puis, nous discuterons 
des méthodes et des résultats obtenus. 

Tous les calculs et discussions s'effectueront à partir des résultats électoraux. Nous 
appliquerons ensuite, directement, les mêmes méthodes aux taux d'abstention. La richesse 
apportée par la comparaison, ou par la multiplication des données, nous permettra de 
mieux comprendre les différentes notions développées pour les résultats électoraux. 

Avec les résultats électoraux 

• Extraction par mélange 

Nous essayons ici de ne pas tenir compte du bruit statistique dû aux tailles finies dans la 
permanence temporelle globale des ctq , et ce de façon purement empirique. Nous voulons 
par ce biais détecter, et mesurer, l'information locale dite positive que contient ctq (cf. 
section EUS]). 

Supposons que l'information locale dite positive se trouve présente dans <7q de manière 
additive. Autrement dit, supposons que nous puissions écrire pour une élection à la date 
t : 

a°(t)=a a (t)+b a (t) , (C-l) 

où a a contient l'information locale dite positive ou pérenne de <7q , et b a renferme tout le 
reste, y compris le bruit statistique dû aux tailles finies. 

Noter au passage que les figures [7J ne tracent que la moyenne de (Jq en fonction de 
7r^ sc , mais ne fournissent aucune indication quant à la position, pour une commune a 
donnée, de <Tq par rapport à cette moyenne. Dit autrement ces figures n'indiquent pas 
si (Jq d'une commune a donnée se trouve, par exemple, constamment au dessus de la 
moyenne, ou fluctue par rapport à celle-ci d'une élection à l'autre. 

Il reste maintenant à savoir comment filtrer a a de ctq ? 

Il convient d'utiliser un filtre qui se base sur ir? nsc afin d'éliminer assez correctement le 
bruit de type binomial dû aux tailles finies des communes (ou des bureaux de vote). n^ nsc 
intervient en effet directement dans <Tq d'une binomiale pure et aussi dans <7q des résultats 
réels (cf. section [2.1.111 Fig. [7] et Tab. [5]). Nous utilisons alors n e échantillons classés en 
fonction de irf nsc , dans lesquels se répartissent les a$ avec un nombre sensiblement égal de 
ctq par échantillon. Nous considérons donc qu'à l'intérieur de chaque échantillon, l'intensité 
du bruit dû aux tailles finies présent dans ctq prenne la même valeur —aux fluctuations 
près. 

La technique d'extraction que nous utiliserons se base sur un échantillonage en n" nsc , 
voire un mélange aléatoire à l'intérieur de chaque échantillon, et repose donc sur les deux 
hypothèses suivantes : 
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- à l'intérieur d'un échantillon, l'amplitude du bruit dû aux tailles finies des communes 
(ou des bureaux de vote) prend sensiblement la même valeur pour tous les <7q ; 

- <Tq (t) peut s'écrire comme <7q = a(t) + b(t), où a(t) exprime la partie permanente 
de (Jq —à laquelle se rattache l'information locale dite à caractère positif—, et b(t) 
dénote tout le reste, dont la partie provenant du bruit statistique des tailles finies. 

Nous discuterons ultérieurement de ces deux hypothèses. 

Notons 

a% = a:(t) + b a e (t) , (C-2) 

l'expression de <Tq de la commune a appartenant à l'échantillon e lors de l'élection à la 
date t. Écrivons ensuite 

a a e (t)=â e (t)+el e (t) , (C-3) 
b:(t) = b e (t)+e« e (t) , (C-4) 

où a e (t) et b e (t) désignent respectivement les moyennes des a" (t) et des 6° (t) à l'intérieur 
de l'échantillon e. Bien évidemment, selon cette écriture et pour une commune centrale 
a donnée, les e n'ont pas de corrélation avec les e^ e , de même les €^ e {U) et e" e (ij) à 
deux dates différentes ti et tj. Les seules corrélations existantes, pour a fixé, concernent 
la partie permanente e (tj) et e (tj). Ainsi, 

(<(U)-<(tj))\ e = Ke(ti).eZM)\ e + fafe) + UU)) ■ + , (C"5) 

où (...}| dénote la moyenne à l'intérieur de l'échantillon e. 

L'équation précédente se simplifie en faisant intervenir la covariance (donnée par l'ex- 
pression cov(X,Y) = (X.Y) — (X).(Y)). En reprenant la notation des corrélations tem- 
porelles (cf. section 12.1.71) . notons cov tit tj (oo), la covariance sur l'ensemble des communes 
centrales a, des cXq des résultats d'élections aux dates U et tj. Restreinte aux communes 
centrales a d'un échantillon e, la covariance s'écrira comme covt^tj (c^o) | ■ L'équation ( 1C-5I ) 
s'écrit alors plus simplement comme : 

«*W ff o)| e = Ke(ti)-e a a, e (tj))\ e = cov ti>t .(a)\ e . (C-6) 

Ainsi, la covariance de la partie permanente a a contenue dans Uq découle directement 
d'un simple calcul de covariance à l'intérieur d'un échantillon —dans lequel l'amplitude 
du bruit dû aux tailles finies prend, par hypothèse, sensiblement la même valeur pour 
tous les <Jq . En d'autres termes, nous avons réalisé une sorte de filtre qui extrait le bruit 
dû aux tailles finies dans la covariance de <Jq . 

La covariance sur l'ensemble des communes de a a , qui, rappelons-le, contient la partie 
pérenne de <Jq , s'écrit alors comme : 

cov taj (a) = œv u,t, (ab) | e • (C-7) 

e 

Un autre variante, qui nous semble plus familière que la précédente, permet d'obtenir 
facilement le terme coft 4) ^(a). 

Mélangeons aléatoirement les valeurs des <Tg à l'intérieur d'un échantillon e. Autre- 
ment dit, <Jq mel prend la valeur o"q de la commune centrale (3, où les communes a et (3 
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appartiennent obligatoirement au même échantillon e. En brisant de la sorte la partie per- 
manente a a de o"q —ou plus précisément la partie e" e , et ce sans atteindre à la moyenne 
â e — , il vient : 

covt i ,t j (cro,mei)\ e = . (C-8) 

Ce qui donne un résultat simple pour le calcul de la covariance étendu à l'ensemble des 
communes a : 

cov tittj (cro,mei) = cov ti<tj (a ) - cov tiitj (a) . (C-9) 

Puisque le mélange à l'intérieur d'un échantillon e n'affecte en rien la variance des Uq , 
l'équation précédente permet d'utiliser comme de coutume les corrélations C ti)t . des <r et 
des <7 0i mei pour aboutir au résultat suivant : 

cov tittj (a) _ i C tijt .(a 0tme i) (CIO) 



cov ta .{(J Q ) C kttj (a ) 

Cette opération se répète ensuite à tous les couples d'élections afin d'obtenir les 
moyennes des covariances et des corrélations, notées respectivement covt et Ct- Les valeurs 
de 'ïï'insc o variant peu d'une élection à l'autre, le même échantillonage en irf nsc , tiré des 
inscrits de l'élection 2007, sert à tous les couples d'élections. Nous pouvons alors définir 
le ratio significatif minimal, (ou R.S.M.) comme : 

R.S.M. d H . (C-lf) 

cov t {a ) 

Le ratio significatif minimal fournit la proportion minimale occasionnée par la composante 
spécifique, permanente de <Tq dans la covariance temporelle des a^. Autrement dit, le 
R.S.M. procure par valeur minimale, la contribution due à la partie permanente, a a , de 
o"q dans la covariance temporelle globale de o"q . Le terme « significatif » doit se comprendre 
au sens d'une information pérenne, attachée à la zone géographique sur laquelle se calcule 
(Tq —comme nous l'avions discuté à la section [2.1.121 « Minimal », puisque la démarche 
précédente ne permet pas d'extraire la totalité de l'information pérenne, exprimée par a a . 
En effet, pour un couple d'élections ti, tj, la technique utilisée ne permet d'accéder qu'à 
cov tut .(a) = (e2(ti).e"(tj)), sans pour autant avoir accès aux moyennes de a a (comme par 
exemple â e (tj), etc.). 

D'après l'équation (1C-10I) . il vient : 

R.S.M. ~ 1 - ^°' me;) . (C-12) 

Pour écrire l'égalité des deux termes de l'équation ci-dessus, il faudrait que les écarts- 
types des Uq (t) prennent une valeur constante pour toutes les élections. Mais comme elle 
varient peu d'une élection à l'autre, l'écart entre les valeurs des membres de droite des 
équations ( 1C-111 IC-121) reste faible : inférieur à 1% pour toutes les mesures qui suivront. 
Autrement dit, ici, nous appliquerons indifféremment l'une des deux équations donnant 
le R.S.M. 

Éprouvons maintenant la bonne qualité du filtre, qui, dans la négative, rendrait ca- 
duque cette méthode. Pour cela, nous usons comme précédemment des <Tq calculés à par- 
tir des r a simulés. La simulation consiste en un tirage binomiale de moyenne p sur N" xpr 
événements. (La valeur p (voir Tab. IA-11) et l'ensemble des N" xpr par commune, ou par 



bureau de vote, proviennent encore des valeurs réelles obtenues pour l'élection concernée.) 



104 



Avec un nombre d'échantillon n e = 72 en 7Tj nsCj o, le ratio significatif minimal, idéalement 
nul avec un filtrage parfait, devient pour les <Tq d'origine binomiale —par commune ou 
par bureau de vote— inférieur à 1%. Ce qui nous satisfait. Nous avons opté pour n e = 72 
(ce qui correspond à environ 500 communes centrales a par échantillon) plutôt que pour 
n e = 36 employé jusqu'alors, afin d'améliorer le procédé utilisé et obtenir d'un R.S.M. 
théoriquement nul, une valeur inférieure à la barre symbolique de 1%. A titre indicatif, 
avec un mauvais filtrage, constitué par exemple avec n e = 72 échantillons en N insc ^ COUT (cf. 
Eq. (jUJ)), le ratio significatif minimal des <Tq d'origine binomiale par commune vaut 17%. 
Nous avons répété l'opération avec des r a simulés selon le « modèle zéro » et avons obtenu 
les mêmes conclusions, à savoir qu'avec n e échantillons en Trf nsc , le R.S.M prend une va- 
leur inférieur à 1% —tandis qu'avec un mauvais filtrage, avec N insc ^ cour par exemple, le 
R.S.M avoisinerait les 80%. Notons néanmoins que les r a qui ont servi à vérifier la qualité 
du filtre proviennent tous deux d'événements indépendants (i.e. des votes indépendants) 
au niveau de la commune elle-même, voire entre les n p communes de l'environnement pour 
le « modèle zéro ». 

La table 10-11 fournit les différentes valeurs conduisant au ratio significatif minimal 
dans les <Tq des résultats électoraux, calculés par commune ou par bureau de vote. Une 
partie pérenne de <Tq , associée à une information locale dite positive, contribue donc à 
hauteur minimale de 15% dans la permanence temporelle globale des o~q. 



TAB. C-l — Ratio significatif minimal (voir texte) obtenu pour les 
calculés à partir des résultats électoraux par commune ou bien par bu- 
reau de vote. 

La table IC-ll calcule les corrélations sur chaque couple d'élections différentes de (o~q — 
<7o, e ), où <To, e dénote la moyenne des ctq à l'intérieur de l'échantillon e en 7i insCt0 . Comme 
covti,tj{°'o — &o, e) = covti,tj{ a ) d'après l'équation (1C-7I) . cette corrélation concerne uni- 
quement e™ e + e et fait mieux ressortir les corrélations dues à l'information locale, 
à caractère dit positif, de o"g (ou plus précisément à e ). Pour mieux comprendre, 
cette corrélation a une valeur nulle, ou inférieure à 1%, avec des <7g provenant des ti- 
rages binomiaux ou du « modèle zéro » . Bref, la table IC-ll montre plus spécifiquement 
les corrélations temporelles d'une information locale contenue dans erg . Comparée à la 
table [ïï] qui relate les corrélations temporelles globales de dg, C tijt .((7o — ôo, e) prend des 
valeurs inférieures à C tt) t (o~ Q ) et surtout fluctue davantage d'une élection à l'autre. Les 
corrélations C^. (<7 — cfo, e) deviennent par la même plus significatives que les Ct^tAco) 
—puisqu'elles possèdent une moindre part de bruit dû aux tailles finies. 

Les figures IC-ll tracent quant à elles les valeurs moyennes des corrélations C% à 
l'intérieur des n e = 72 échantillons en vrj nsCj0 . Elles montrent que l'information pérenne 



TAB. C-2 Corrélation temporelle 

Ct i} tj(co — &0,e) (voir texte) sur chaque 
couple d'élections (ti,tj), et pour les 
résultats des élections. A comparer aux 
corrélations Ct u u((Ta) à la table dans 
lesquelles contribue le bruit dû aux tailles 
finies. 





R.S.M. 


com. 
bur. 


0,15 
0,15 



U ^\ 


1995 


2000 


2002 


2005 


2007 


1992 


0,19 


0,11 


0,16 


0,12 


0,14 


1995 




0,11 


0,13 


0,32 


0,54 


2000 






0,12 


0,05 


0,09 


2002 








0,14 


0,12 


2005 










0,30 
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contenue dans <Tg se trouve davantage présente dans les zones à forte population (i.e. à 
faible irf nsc ), et se décèle mieux encore à partir des résultats par bureaux de vote. Re- 
marquons néanmoins que les résultats électoraux connus à l'échelle des bureaux de vote 
concernent uniquement quatre des six élections traitées. 

Notons que cette méthode de filtrage n'affecte pas véritablement la grandeur Tq, peu 
sensible en effet au bruit dû aux tailles finies de par sa définition même. En remplaçant 
<Tq par Tq dans les équations ci-dessus, il vient (cf. Eqs. ()C-7[ IC-lT]) ) pour l'équivalent du 



R.S.M. des Tq : ^ e __ — = 95%. (La moyenne sur tous les couples d'élections s'effec- 
tue ici avec les valeurs absolues \cov ti> t ( r o)| de manière à prendre en compte toutes les 
élections, et ce indépendamment de leur choix gagnant à l'échelle nationale). Un R.S.M. 
équivalent pour les Tq proche de 1 signifie, conformément à ce dont nous nous attendions, 
que le bruit dû aux tailles finies ne contribue quasiment pas à la permanence temporelle 
des Tq. 

Nous venons de montrer qu'un minimum de 15% environ de la corrélation temporelle 
des <Tq des résultats électoraux par commune (ou par bureau de vote), provient d'une 
information attachée à la zone géographique de Tq, et dénuée de bruit dû au tailles 
finies des communes (ou des bureaux de vote). En outre, cette information locale, dite 
à caractère positif, intervient davantage dans les zones à forte population que dans les 
autres zones géographiques moins peuplées, et semble plus apparente avec des résultats 
électoraux mesurés à l'échelle du bureau de vote. 

Nous avons suivi deux hypothèses pour établir les points dégagés ci-dessus. La première 
considère la partie pérenne a a , présente dans <Tq de manière additive ; et la seconde 
pose que le bruit dû aux tailles finies dépend de irf nsc uniquement. (Nous discuterons 
ultérieurement de ces deux hypothèses.) 

Nous n'avons pas essayé de comprendre sous quelle forme apparaît l'information locale 
à caractère positif, présente dans (Tq . Nous avons considéré ici Tq à l'image d'une boîte 
noire dans laquelle intervenaient notamment un mélange et un échantillonage. Voyons 
maintenant une façon plus physique de concevoir l'information à caractère positif associée 



• ctq et les corrélations intercommunales 

L'information à caractère positif, d'ordre sociologique ou politique, contenue dans (Jq 
peut aussi se comprendre —parmi d'autres manières— comme l'état interne des corrélations 
des communes (ou des bureaux de vote) de la zone géographique, V° 6 , sur laquelle s'évalue 
(Tq. Nous avions abordé ce point à la section [2. 1.121 et abandonné cet angle d'attaque à 
cause de l'absence de modèle de vote à l'échelle communale. Nous tentons ici de mesu- 
rer l'état des corrélations intercommunales des communes (ou des bureaux de vote) du 
voisinage V° 6 de la commune centrale a, en contournant le problème crucial d'absence de 
modèle. Rappelons aussi que nous nous soucions non seulement de l'état des corrélations 
des communes (ou des bureaux de vote) à l'intérieur de V" 6 à une élection donnée, mais 
aussi de la permanence de cet état de corrélation au cours de chacune des élections. Plus 
clairement, un même état de corrélation des communes (ou des bureaux de vote) de Vf 6 à 
chaque élection témoigne d'une information à caractère positif sur la zone géographique 
considérée ; une information que nous nous efforçons de déceler. 

L'idée de base du procédé utilisé s'appuie sur une comparaison entre <Tq réel et une 
autre de valeur, notée <t ", que pourrait prendre la déviation standard des n p communes 
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FlG. C-l - A l'intérieur des 72 intervalles en 7Tj nsC) o de 2007 : moyenne Ct(o"o)| , avec la 
dispersion standard en barre d'erreur, des corrélations temporelles des ctq des résultats électoraux 
sur l'ensemble des couples d'élections. A gauche, les ctq proviennent des résultats par commune, 
et à droite, par bureau de vote. Pour mémoire, sur l'ensemble des communes (voir Tab. [3]), 
Ct(&o) = 0, 579 ± 0, 060, et sur l'ensemble des bureaux de vote, Ct(ao) = 0, 519 ± 0, 085. 

autour de la commune centrale a en l'absence de corrélation interne. La connaissance de 
ces deux valeurs nous permettra d'évaluer le taux de corrélation des r des n p communes, 
r Q , par le biais de la connexion de ces n p résultats r à une même grandeur locale. Il 
suffira ensuite de calculer les corrélations temporelles des r a sur l'ensemble des communes 
centrales a, pour évaluer l'information à caractère dit positif contenue dans cTq . Mais rap- 
pelons que l'intérêt majeur de cette partie réside dans une compréhension plus physique 
de l'information locale à caractère positif, appréhendée ici comme l'état des corrélations 
intercommunales. 

Supposons que les résultats r des n p plus proches communes de la commune centrale 
a dépendent d'une grandeur locale, l a , assignée à la zone géographique autour de la 
commune a. Notons r a , le taux de corrélation, ou le rapport de corrélation, qui exprime 
le degré de corrélation entre un résultat r et la grandeur locale l a . (Si le coefficient de 
corrélation entre deux variables aléatoires Y et X, vaut C, alors Y = ±i/rl + Vl — rr], 
où 7] dénote un bruit sans corrélation, et r le taux de corrélation tel que C 2 = r. Dans 
le cas d'une corrélation positive (i.e. C > 0), l'équation précédente prend le signe +, et 
inversement dans le cas d'une anti-corrélation. Dans l'écriture précédente, les variables 
aléatoires X, Y et rj ont une moyenne nulle et une variance unité.) Par extrapolation et 
avec une corrélation positive, la commune /3, parmi les n p communes en question, a un 
résultat t 13 qui peut alors s'écrire comme : 



où l et r/ dénotent respectivement l'information locale et un bruit additionnel, considérés 
tous deux comme de moyenne nulle et de variance unité à l'intérieur d'un ensemble donné. 
(Par la suite, les communes centrales a à l'intérieur d'un échantillon e en 7Tj nsc o consti- 
tueront l'ensemble des valeurs considérées.) Pour simplifier, les r ont aussi une moyenne 
nulle sur cet ensemble, et a T exprime l'écart-type des r en l'absence de corrélation. 
L'écart-type de ces n p communes qui en résulte devient alors 




(C-13) 




Vl - r a a T . 



(C-14) 
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Le cas des n p communes complètement corrélées —ou anticorrélées— (i.e. r a = 1) à la va- 
riable locale donnerait évidemment <Tq = 0, alors que le cas des communes indépendantes 
(r Q = 0) fournirait 0"q = cr T . 

L'équation (1C-14I) permet donc d'évaluer le taux de corrélation intercommunale r a . 
Mais pour cela, il faut nécessairement connaître à la fois, <Tq et un intermédiaire calcu- 
latoire, o T : l'écart-type qu'aurait les résultats de ces n p communes en l'absence d'inter- 
corrélation à une variable locale. <Tq se mesure directement à partir des données (cf. 
Eq. ©). Il reste donc à déterminer a T , ce que nous allons tenter de faire. 

Comme nous venons de le voir, sans connexion des résultats à une variable locale (i.e. 
r a = 0), (jg = cr T . De plus, a T doit préserver le bruit dû aux tailles finies des n p communes. 
Une manière de déterminer a T consiste alors à évaluer l'écart-type des résultats électoraux 
r des n p communes, non pas à partir des communes de la zone V" 6 où se calcule ctq et qui 
ont une connexion à la même grandeur locale, mais à partir d'autres communes ayant le 
même bruit dû aux tailles finies et connectées avec des grandeurs locales différentes. Dit 
autrement, nous déterminons un nouvel écart-type, noté a' a , obtenu à partir des résultats 
électoraux de n p communes, de même population que chacune des n p plus proches com- 
munes de a, mais situées des endroits différents —ce qui leur interdit de partager la même 
connexion à la même variable locale. L'opération consiste alors à mélanger aléatoirement 
les résultats des communes en fonction de leur taille de population, N expr , et de calcu- 
ler ensuite un nouvel écart-type a' Q a . Ainsi cr' a possède, d'une part, l'avantage d'avoir le 
même bruit dû aux tailles finies que <Tq , et, d'autre part, une absence d'inter-corrélation 
des résultats électoraux des communes prises en compte —puisque les n p communes prises 
en compte ne partagent pas leur connexion à la même grandeur locale. En revanche, cette 
méthode assigne arbitrairement un comportement commun à toutes les communes de la 
France entière ayant la même population. En d'autres termes, o T doit posséder la même 
valeur, aux fluctuations près, pour toutes les communes centrales ayant la même valeur 
de vTj nsc . Nous reconnaissons volontiers cet arbitraire, mais sans modèle de vote fin, à 
l'échelle microscopique (de l'individu), voire à l'échelle intra ou intercommunale, nous 
n'avons pas trouvé d'autre façon de casser les corrélations intercommunales —exprimées 
ici par le biais d'une connexion à une variable locale— tout en préservant le bruit dû aux 
tailles finies inclus dans <Jq. 

Plus rigoureusement, en notant (...)| la moyenne sur l'ensemble des communes cen- 
trales a d'un même échantillon e, ayant la même valeur de 7r insCj , et en supposant natu- 
rellement l'absence de corrélation entre r a , l a et rf dans l'équation (1C-13I) . il vient d'après 
ce qui précède : 

(<) 2 ^[(r)\ e (i% + (i-(r)\ e )(v 2 )\ e ].M 2 = K) 2 • (c-i5) 



Concrètement, nous avons pour chaque élection mélangé aléatoirement les résultats 
des communes (ou bien des bureaux de vote) à l'intérieur de chacun des 72 intervalles en 
N expr - Ceci a permis de calculer a' a pour chaque commune centrale a. Pour amoindrir 
l'effet des fluctuations des a' a , qui présentent la même intensité due aux tailles finies pour 
les mêmes valeurs de 7rj nsc , nous calculons leur moyenne à l'intérieur de 72 intervalles de 
Kinsc, o- Des équations (IC-141) et (IC-151) découle alors le taux de corrélation recherché r a , 
qui s'écrit comme : 

"■ =i -w (c - i6) 
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FlG. C-2 — Taux de corrélation intercommunale r a calculés avec l'équation ()C-16p . en fonction 
de irf nsc o ; évalués à partir des <7q des résultats, par commune à gauche, et par bureau de vote 
à droite. Les 72 intervalles en 7Tj nsCi o proviennent de l'élection 2007-b. 

où ((o"o) 2 )| signifie la moyenne des (cr' ) 2 de l'intervalle en 7ii nsCj o dans lequel se situe 

insc, 0' 

Une fois obtenue le taux de corrélation r a pour chaque commune centrale a, et pour 
chaque élection, il ne reste plus qu'à calculer comme précédemment les corrélations tem- 
porelles Cttjij) des r a . L'information que nous appelons locale et à caractère positif se 
manifeste, selon les discussions précédentes (voir section I2.1.12p par la permanence tem- 
porelle des r a —à un éventuel décalage global près, dû à la moyenne des r a de l'élection 
considérée—, et se mesure par Ct(r). Précisons pour lever toute ambiguïté, que l'informa- 
tion locale dite positive ne réside pas dans la valeur de l a , potentiellement variable d'une 
élection à l'autre, mais dans l'état des corrélations intercommunales r a . Et plus encore, 
dans leur permanence temporelle. 

Nous nous attendons qu'en l'absence de corrélation intercommunale r a , i.e. en l'ab- 
sence de cette fameuse information locale à caractère positif dont nous cherchons tant 
la trace, Ct{r) prenne une valeur nulle. Nous le vérifions pour les... r' a dérivés des a' Q a 
—qui ne possèdent évidemment pas, par construction même, d'information locale à ca- 
ractère dit positif. (Ci(r') ~ 0,6%, inférieur donc au 1% symbolique.) Notons toutefois 
que, si la moyenne ((ctq) 2 ) de l'équation (10-16|) se déterminait à l'intérieur des échantillons 



en N insCyCOUr au lieu des échantillons en 7i insCy o, et avec encore a' a au numérateur de la 
même équation, on obtiendrait Ct(r') ~ 13%. Ce qui confirme de nouveau la pertinence 
des échantillons en n insCtQ pour éliminer le bruit dû aux tailles finies, du moins, dans le 
cas des événements (ou des résultats électoraux par commune ou par bureau de vote) 
indépendants. Notons enfin que cette vérification présente une faille : les r' a , par leur 
simple fluctuation, prennent ici des valeurs tant positives que négatives, alors qu'ils de- 
vraient rigoureusement prendre uniquement des valeurs positives. 

Bref, les figures IC-61 tracent la moyenne des r a en fonction de 7r insCj , en utilisant 
l'équation (lC-16p . et pour les Uq déterminés à partir des résultats par commune ou bien 



par bureau de vote. (La démarche précédente établie à partir des résultats par commune, 
s'étend sans aucune difficulté aux bureaux vote, avec comme seule différence, un nombre 
de bureaux vote non uniforme pour l'ensemble des Vf 6 .) Excepté éventuellement pour 
les zones à plus forte population (i.e. pour celles à plus faible 7i insCt0 ), r a diminue quand 
la population augmente (i.e. quand 7rj nsc augmente). Noter les plus faibles valeurs des 
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r a de l'élection 2000-b par rapport aux cinq autres élections ; ce qui s'accorde avec les 
plus faibles corrélations spatiales entre proches communes {C(R ~ 1) de cette élection en 
comparaison aux cinq autres élections (voir Fig[ïï]). 

La table IC-31 fournit C t {r) à partir des Gq calculés à partir des communes, ou bien à 
partir des bureaux de vote. Chacune de ces valeurs dépasse les 20%, et dépasse le ratio 
significatif minimal calculé précédemment à la table IC-11 Nous discuterons plus loin de 
cette différence. 





Ct(r) 


com. 
bur. 


0,24 
0,22 



TAB. C-3 — Moyenne Ct(r) des corrélations temporelles sur l'ensemble 
des couples d'élections des taux de corrélation intercommunale r a , issues 
des résultats par commune ou par bureau de vote. r a se détermine à 
partir des <7q et en utilisant l'équation (|C-16p . 



En résumé, nous venons de déterminer le taux de corrélation des communes à une 
grandeur locale, appelé également état de corrélation intercommunale, r a . Nous l'avons 
effectué —en l'absence de modèle de vote à l'échelle infra ou intercommunale— de manière 
indirecte, sous l'hypothèse d'un bruit potentiel, g t , similaire pour toutes les zones ayant 
le même 7ii nS c,o- H apparaît sous cette condition que l'état des corrélations, r a , diminue 
quand les populations diminuent, excepté dans les zones aux très fortes populations, et 
prend des valeurs sensiblement similaires à l'exception de l'élection de 2000. L'information 
locale à caractère positif se comprend physiquement ici par l'intermédiaire de l'état des 
corrélations intercommunales. Et plus particulièrement par leur permanence temporelle, 
C t (r), ici de l'ordre de 20%. 

Ces résultats concernent l'ensemble des communes (ou des bureaux de vote) de la 
France entière. Essayons, certes de manière anecdotique, de cartographier les zones à plus 
moins forte information locale pérenne. 



• Une visualisation de la persistance temporelle de <Tq 

Essayons, à titre indicatif, de visualiser les zones à plus ou moins forte persistance 
temporelle des <Tq . 

Jusqu'ici nous nous avons déterminé des corrélations (des g$ ou des r a ) sur toutes les 
communes pour des couples d'élections différentes. Afin de connaître les communes cen- 
trales a pour lesquelles Gq varie plus ou moins fortement, nous devons procéder autrement. 
Nous devons engager une seule commune la fois, et au travers de plusieurs élections. 

Notons A[ CT «] t l'écart-type que prend Gq sur toutes les élections traitées. Ne s'occuper 
que de A[ CT «] t pour déterminer si Gq fluctue plus ou moins fortement d'une élection à 
l'autre n'a pas véritablement de sens. Il faut aussi tenir compte de la moyenne (<7q )t des 
o"o d'une commune a sur toutes les élections. Autrement, par exemple les zones à fort 
bruit dû aux tailles finies, et donc à fort Gq , auraient d'emblée plus facilement une forte 
variation de leurs o"q . Il convient donc d'utiliser le coefficient de variation, c", des valeurs 
que prend a$ d'une commune a donnée, à chacune des élections : 

« - m ■ (CM7) 

La figure IC^3l représente la position des communes centrales a, selon la répartition en 
14 niveaux des c". Les Gq ne proviennent sur cette figure que des résultats par commune. 
Les résultats par bureaux de vote n'auraient guère de sens avec à peine 4 élections connues 
à cette échelle. 
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FlG. C-3 — Position XY des communes 
centrales des coefficients de variation de ctq . 
Les (Tq proviennent des résultats des com- 
munes. Les (cf. Eq. (1C-17|) ) se classent 
en 14 intervalles, partant du violet pour les 
plus faibles valeurs, au noir pour les plus 
fortes. Les zones à faible indiquent une 
forte information locale positive pérenne. 
Noter les différences avec la carte de la 
répartition des o"q à la figure IA-61 



6 valeurs pour calculer un coefficient de variation n'a rien de vraiment glorieux non 
plus, diriez-vous. Voilà pourquoi nous n'avons pas abordé le problème de la permanence 
des <Tq par ce biais. Mais puisque nous aimons à croiser différents angles de vue d'un 
même phénomène, ne gâchons surtout pas notre plaisir en indiquant ce qu'aurait apporté 
cette méthode. 

Comme précédemment, nous pouvons comparer les écarts- types A[ CT «] t à ceux issus d'un 
mélange à l'intérieur d'un même échantillon en 7Tj nsC) o, et ce pour casser la permanence 
temporelle (à la moyenne d'ensemble près) attachée ctq. (L'argumentation reprend les 
mêmes termes, notations et remarques précédents.) En passant ensuite à l'ensemble des 

(A [cr a ]t ) 

communes a : ^ A 0, ™ e '^ = 1, 09, où (...) dénote la moyenne sur l'ensemble des communes 

centrales a. Ainsi, la grandeur qui s'apparente au ratio significatif minimal —dans le sens 
où il se préoccupe aussi de permanence temporelle des a^- vaut par cette façon environ 
9%, au lieu de 15% comme précédemment. Nous accordons moins de crédit à la façon 
entreprise dans cette partie, à cause du plus fort bruit qu'elle implique à la base (i.e. dans 
le calcul de A^jJ. Constatons néanmoins la concordance approximative des deux calculs. 

• Résumé 

En résumé, nous avons vu que <Tq d'une même commune centrale a contient une partie 
pérenne d'une élection à l'autre, et indépendante du bruit dû aux tailles finies des com- 
munes (ou des bureaux de vote). Cette partie permanente exprime très probablement une 
information spécifiquement locale à teneur dite positive, i.e. toute particularité locale, à 
l'exception de ce qu'implique la taille de la population par le biais du bruit statistique 
des tailles finies. Cette partie pérenne de o"q contribue à hauteur minimale de 15% dans 
la permanence temporelle globale des <Tq —mesurée par Ct(cro). 

L'une des manières de comprendre cette information locale à caractère positif réside 
dans l'état des corrélations des résultats électoraux entre communes voisines (ou entre 
les bureaux de vote voisins). Nous avons essayé de mesurer indirectement ces corrélations 
intercommunales en les comparant à ce qu'aurait fourni une absence d'interconnexion. 

L'état des corrélations intercommunales et la partie pérenne de o~q se réfèrent toutes 
deux à la présence d'une information locale à caractère positif. Néanmoins ces deux notions 
ne s'identifient pas, à proprement parler, l'une à l'autre. Ceci explique pourquoi les mesures 
des tables IC-ll et 10-31 se différencient à ce point. D'autant plus que l'une des mesures, 
le R.S.M. concerne une mesure a minima. Par contre, ces deux notions indiquent une 
présence de l'information locale et positive globalement plus forte dans les zones à forte 
population. 
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Enfin la carte 10-31 représente les zones à plus ou moins fort coefficient de variation des 
<7q d'une même commune centrale et sur l'ensemble des élections analysées. Cette carte 
fait apparaître —heureusement— des différences avec la carte des plus ou moins grandes 
valeurs de Œq lors de l'élection de 2007-b (cf. Fig. IA-61) . 

Toutes les conclusions ci-dessus chancelleraient si les hypothèses sur lesquelles elles 
reposent ne tenaient pas. Discutons-les donc. 

• Discussion des hypothèses 

Selon la première méthode utilisée, la recherche de la partie pérenne a a présente dans 
cTq à diverses élections se fonde sur les deux hypothèses suivantes : 

- l'amplitude du bruit statistique dû aux tailles finies des communes (ou des bureaux 
de vote) ne dépend que de ^f nsc ; 

- (Tq = a a + b a , i.e. cTq se décompose entre, d'une part a a qui contient la partie per- 
manente recherchée de <Tq , et d'autre part tout le reste, b a , comprenant notamment 
le bruit statistique des tailles finies. 

Quant à la recherche de l'information locale positive au travers de l'état des corrélations 
intercommunales, celle-ci se base sur l'hypothèse d'un bruit statistique global (comprenant 
notamment le bruit dû aux tailles finies) identique à l'intérieur d'un même échantillon en 
Tif nsc . Selon cette seconde méthode d'investigation, l'état des corrélations, r a , intercom- 
munales se détermine ensuite par l'équation (10-16[) . 

Dans les deux cas, la grandeur recherchée (a a ou r a ) se réfère à un bruit statistique à 
l'intérieur d'un échantillon (celui de b a , ou de {(<j' ) 2 ) | ). La grandeur recherchée issue de 
o"o , se rapporte au bruit de l'échantillon : dans le premier cas, de façon additive, et dans 
le second cas, de façon multiplicative. 

Précisons de nouveau que les deux méthodes précédemment développées ne se prétendent 
pas rigoureuses. Nous les avons néanmoins utilisées afin de pallier l'absence de modèle de 
vote. Cette différence d'approche, de méthode, dans la façon d'utiliser le bruit statistique 
de l'échantillon ne constitue nullement un handicap. Bien au contraire, ces deux méthodes 
différentes permettent toutes deux de déceler et de mesurer —y compris a minima— la 
présence d'une information locale positive dans <Tq . Bien que non rigoureuses, elles at- 
testent donc, par une sorte de faisceau de convergence, l'existence d'une information 
locale dite positive dans <Tq . 

Quelques remarques complémentaires néanmoins. En utilisant la première méthode, 
non pas avec cXq mais avec (<Tq ) 2 (i.e. (ctq ) 2 = a' a + b' a , où a' a renferme la partie pérenne de 
(<Tq) 2 )), nous obtenons les mêmes R.S.M. que ceux de <Tq , à 1% près. Notons que l'égalité 
—prévisible— des R.S.M. de (ctq ) 2 et de ctq ne dément pas la méthode utilisée —sans pour 
autant la confirmer pleinement. Enfin, en l'absence de modèle de vote, nous n'avons pu 
établir comment le bruit binomial dû aux tailles finies intervient dans cXq . (Nous n'avons 
pu, ni le retrancher, ni le diviser, etc. de <7g .) Nous avons simplement considéré son in- 
tensité comme constante à l'intérieur d'un échantillon en 7r? lsc . 

Passons maintenant à l'épreuve la seconde hypothèse, relative dans les deux méthodes 
au bruit statistique des Uq à l'intérieur des échantillons. 

Avec la première méthode, les <Tq d'un échantillon e doivent avoir le même niveau de 
bruit dû aux tailles finies —aux fluctuations près, évidemment. Notons que l'échantillon 
peut aussi contenir une information locale pérenne, moyenne à l'ensemble des <Tq (i.e. â e ), 
mais non prise en compte dans la mesure minimale du R.S.M.. 
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Selon la seconde méthode, non seulement l'échantillon e doit avoir pour les <Tq le même 
niveau de bruit statistique dû aux tailles finies, mais aussi le même niveau « d'agitation » 

des résultats r (er T = J ((cr' ) 2 ) |^ ) lors d'une hypothétique absence de corrélations inter- 
communales. 

Rappelons une fois de plus qu'en l'absence de modèle de vote, nous n'avons pas trouvé 
d'autre moyen pour mesurer, dans ctq purgé de son bruit statistique dû aux tailles finies, 
la présence d'une information locale dite positive. 

Nous avons précédemment vu, pour les deux méthodes, l'importance de la grandeur 
servant à l'échantillonage (cf. un échantillonage basé sur N^ lsc cour , plutôt que sur ir^ nsc 
pour le tirage binomial, ou pour le « modèle zéro »). Il importe donc dans les deux 
méthodes que la grandeur, sur laquelle se bâtit l'échantillonage, exprime le bruit sta- 
tistique dû aux tailles finies. 

Dans le cas d'un vote indépendant, ce bruit statistique procède de 7T^ nsc (ou une 
grandeur assimilée à 7r^ nsc si nous tenions compte des suffrages exprimés plutôt que du 
nombre d'inscrits sur les listes électorales) comme nous l'avions vu à la section 12.1.111 
Or, les résultats réels attestent incontestablement l'existence d'un vote non indépendant, 
i.e. corrélé, et à l'intérieur des communes (cf. Annexe IDl) . et entres différentes communes 
voisines (cf. Annexe [D] ou Figs. [ïï] et [TT]). Et en l'absence de modèle de vote, nous ne 
savons pas quelle grandeur exprime le bruit statistique dû aux tailles finies. Nous avions 
simplement constaté la similarité d'allure des <Tq réels, et ceux issus d'un tirage binomial 
de probabilité uniforme (cf. sections [2.1.91 et [2. 1 . . Ce qui nous a conduit à considérer 
que 7r? nsc o exprime également le bruit statistique dû aux tailles finies dans les cXq des 
résultats électoraux réels. 

Or, l'absence de modèle de vote implique que nous ne pouvons pas tester rigoureu- 
sement l'hypothèse que nous avons utilisé, à savoir un bruit statistique dû aux tailles 
finis, exprimé par itf nsc Q . Nous n'allons pas nous décourager pour autant, et encore moins 
abandonner la discussion à ce stade. D'autant plus que cette annexe, rappelons-le, ne peut 
avoir de caractère rigoureux. Bref, nous n'allons pas tester rigoureusement l'hypothèse ci- 
dessus, mais sa robustesse. Nous voulons voir si une modification de la grandeur (ir? nsc 
selon l'hypothèse retenue), qui exprime le bruit statistique dû aux tailles finies, modifie 
notablement les précédentes mesures. 

L'expression de vr^ sc provient d'un bruit dû aux tailles finies par commune propor- 
tionnel à -7= (cf. section 12.1.111) . où A" dénote la taille de la population. Nous allons 
donc considérer la variante de ce bruit, pour les résultats réels, proportionnel à w, où 
l'exposant a, précédemment égal à 0,5, s'étend de 0, 1 à 1. Avec cet hypothétique bruit 
statistique dû aux tailles finies dans chaque résultat r a , et en suivant la même démarche 
qu'à la section 12.1.111 le bruit dû aux tailles finies s'exprimerait dans par : 
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(C-18) 



Nous obtenons de la sorte, une nouvelle grandeur, n a (a), qui englobe la grandeur 
TT? nsc o retenue jusqu'alors. Nous testons ensuite la robustesse de l'hypothèse d'un bruit 
dû aux tailles finies et exprimé par 7i^ nsc (i.e. par a = 0, 5 dans l'équation ci-dessus) en 
faisant varier l'exposant a autour de a = 0, 5. 

La figure E3] trace le R.S.M. et Ct(r) de la même façon que précédemment, mais en 
fonction des échantillons en vr a (a), au lieu de itf nsc - H ressort que le coefficient a = 0, 6 
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FlG. C-4 - R.S.M. et C t {r) calculés comme 
précédemment, mais avec des échantillons 
en 7r Q (a) (cf. Eq. ([IEEE])). Remarque : 
irf nac g s'obtient avec a = 0,5. 



""0 0.2 0.4 0,6 0.8 1 

a 

conviendrait peut-être mieux que a = 0, 5 à la base de ~Kf nsc . Mais plus important encore, 
nous voyons que les résultats ne se modifient guère par modification de l'exposant a autour 
de la valeur que nous avions précédemment utilisée, à savoir a = 0,5. 

En conclusion, même si nous n'avons pu tester rigoureusement l'hypothèse d'un bruit 
statistique dû aux tailles finies exprimé par irf nsc dans cXq , nous avons cependant vérifié la 
robustesse de cette hypothèse en modifiant l'expression de 7T^ nsc . (Il existe probablement 
d'autres façons de modifier Tr^ nsc , mais nous nous contenterons de celle-ci. Elle nous paraît 
en effet suffisamment générale, en l'absence de modèle de vote, pour s'en satisfaire.) 

Avec les taux de participation 

Recherchons maintenant la présence d'une information locale dite positive dans les <7q 
des taux de participation. Pour cela nous appliquerons, directement et sans les discuter, 
les précédentes méthodes établies pour les <Tq des résultats électoraux. Nous noterons, 
quand l'occasion s'en fera ressentir, les différences avec les mesures précédentes. Et une 
fois de plus, la comparaison entre données différentes (ici, les résultats électoraux et les 
taux de participation) permettra, espérons-le, d'enrichir la compréhension des notions 
développées. 

Précisons au préalable que les deux informations locales à caractère positif, présentes 
dans les (Jq soit issus des résultats électoraux soit issus des taux de participation, ne 
s'identifient pas obligatoirement l'une à l'autre. En effet, les choix que sollicitent l'expres- 
sion des votes ne s'identifient pas forcément aux choix impliqués par une participation ou 
non à une élection. 

La table IC-41 fournit les R.S.M. des a§ calculés à partir des taux de participation 
par commune ou par bureau de vote. Que les R.S.M. des taux de participation prennent 
des valeurs plus grandes que celles correspondantes aux résultats électoraux n'a rien de 
surprenant. Les choix relatifs à la participation aux différentes élections semblent en ef- 
fet plus homogènes entre eux, que ceux relatifs à l'expression du vote en faveur de l'un 
des deux candidats des différentes présidentielles, ou lors d'un des trois référendums ana- 
lysés. L'aspect pérenne de erg se marque alors naturellement davantage pour les taux de 
participation, comparés aux résultats électoraux. 



TAB. C-4 — Ratio significatif minimal (voir texte) obtenu pour les <Jq 
calculés à partir des taux de participation par commune ou bien par 
bureau de vote. 
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FlG. C-5 - A l'intérieur des 72 intervalles en 7Tj nsCi o de 2007 : moyenne Ct(o"o)| , avec la disper- 
sion standard en barre d'erreur, des corrélations temporelles des <7q des taux de participation 
sur l'ensemble des couples d'élections. A gauche, les <Tq proviennent des résultats par commune, 
et à droite, par bureau de vote. Pour mémoire, sur l'ensemble des communes (voir Tab. [8]), 
Ct(oo) = 0, 567 ± 0, 058, et sur l'ensemble des bureaux de vote, Ct(o"o) = 0, 586 ± 0, 067. 

La table IC-51 fournit pour tous les couples d'élections, les corrélations C tu tJcrQ — ëro, e) 
des taux de participation. Le bruit statistique dû aux tailles finies se marque moins que 
pour les corrélations Ct u u (co) des Uq bruts, donnés à la table El Nous pouvons noter que 
certains couples d'élections (entre le premier et le second tour de la même présidentielle) 
se détachent nettement plus des autres couples, dans la table 10-51 comparée à la table El 
Ceci s'explique par une contribution moins prononcée du bruit statistique dû aux tailles 
finies dans la table IC-51 
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Tab. C-5 - Corrélation temporelle C ti ,u (co — &o, e) (voir texte) sur chaque couple 
d'élections (ti,tj), et pour les taux d'abstention. A comparer aux corrélations C tij t 3 (oo) à 
la table El dans lesquelles contribue le bruit dû aux tailles finies. 



Les figures IC-51 montrent les corrélations temporelles des <Tq des taux de participation, 
à l'intérieur de chaque intervalle en 7Tj nsCi0 . Conformément à leurs homologues concernant 
les résultats électoraux (cf. Fig. IC-ll) . l'information locale, dite positive ou pérenne, se 
situe davantage dans les zones à forte population, et se manifeste aussi davantage avec les 
données recueillies à l'échelle des bureaux de vote. 
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FlG. C-6 — Taux de corrélation intercommunale r a calculés avec l'équation ()C-16p . en fonction 
de 

^insc, o j évalues a partir des <Tq des taux de participation, par commune a gauche, et par 
bureau de vote à droite. Les 72 intervalles en iïi nsc ,o proviennent de l'élection 2007-b. 



Les figures IC^BI représentent les taux de corrélation intercommunales, r a , en fonction 
de 7T^ SC , pour chacune des élections considérée pour son taux de participation. Les 
valeurs des r a prennent, comme pour les résultats électoraux, de plus grandes valeurs dans 
les zones à forte population que dans les zones faiblement peuplées. En revanche, nous 
remarquons de plus faibles valeurs des r a , comparées à leurs homologues des résultats 
électoraux (cf. Fig. IC-21) . Ce dernier point s'accorde avec de plus grandes corrélations 
entre communes voisines des r des résultats électoraux, comparées à ceux des taux de 
participation (voir Figs. 131 et fTTl). 

La table IC-61 fournit les corrélations temporelles C t {r) des r Q , issus des <Tq des taux de 
participation à l'échelle des communes ou des bureaux de vote. Bien que les r a des taux 
de participation prennent des valeurs plus faibles que ceux des résultats électoraux, ils 
présentent une corrélation temporelle sensiblement égale à ceux des résultats électoraux. 
Ceci provient probablement d'une plus grande homogénéité des choix relatifs aux taux 
d'abstention, que ceux relatifs aux résultats électoraux —comme nous l'avions déjà évoqué 
plus haut, notamment à la table 





Ct(r) 


com. 
bur. 


0,19 
0,26 



TAB. C-6 — Moyenne Ct(r) des corrélations temporelles sur l'ensemble 
des couples d'élections des corrélations intercommunales c Q , issues des 
taux de participation par commune ou par bureau de vote. r a se 
détermine à partir des Ug et en utilisant l'équation (1C-16|) . 



Enfin, la figure EL7] indique, avec un classement selon leurs valeurs, la position géographique 
des coefficients de variation, c™ (cf Eq. ( 1C-17I) ). des (7q issus des taux de participation par 
commune. Les faibles valeurs de c" indiquent un voisinage Vf 6 d'une commune centrale 
a, pour lequel les <Tq varient relativement peu d'une élection à l'autre ; et témoignent 
de la sorte d'une information locale pérenne relativement forte. Les taux de participa- 
tion par commune concernent 12 élections, à la différence des résultats par commune 
qui n'en considèrent qu'un nombre plus restreint, 6, d'élections. Les coefficients de varia- 
tion d'une commune se noient donc un peu moins dans le bruit statistique dû aux petits 
échantillons, que ceux des résultats électoraux. De plus, avec les taux de participation, 



par commune 



1+20%. Ce qui s'accorde mieux avec le R.S.M. issus des taux de participation 
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FlG. C-7 — Position XY des communes 
centrales des coefficients de variation de Uq . 
Les <7g proviennent des taux de participa- 
tion des communes. Les c" (cf. Eq. (|C-17|) ) 
se classent en 14 intervalles, partant du vio- 
let pour les plus faibles valeurs, au noir 
pour les plus fortes. Les zones à faible 
indiquent une forte information locale po- 
sitive pérenne. Noter les différences avec 
la carte de la répartition des cTg à la fi- 
gure EU 



En conclusion, ces petits calculs et artifices permettent d'établir que <Tq ne mesure 
pas uniquement un bruit statistique dû aux tailles finies des communes (ou des bureaux 
de vote), mais aussi une information stable, inhérente à sa zone d'évaluation, vraisembla- 
blement à caractère politique, sociologique, historique, comportementale, etc. —dite tout 
simplement, positive. Nous n'avons pu —en l'absence de modèle de vote— mesurer rigou- 
reusement son importance, mais avons pu néanmoins, au travers de plusieurs méthodes 
différentes, déceler sa présence et mesurer approximativement son importance. 
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D De l'indépendance des bureaux de vote des zones 
urbaines 





Résultats 
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FlG. D-l - Écarts-types des t™ par bureaux de vote, Ar T j| (notés Ar Tr ] e sur ces figures), en 
fonction du nombre n" de bureaux de vote des communes situées à l'intérieur d'un cercle de 
rayon r d = 8, km centré sur une commune centrale. A gauche, les r° proviennent des résultats 
électoraux, et à droite, des taux de participation. Les fenêtres se restreignent aux bureaux de 
vote de la seule commune centrale. En magenta, la courbe issue du mélange par bureau de vote 
des valeurs de l'élection de 2007-b, et en pointillé, y oc 1/y/x de l'équation (|D-3p . adéquate aux 
processus indépendants. 



Cette annexe s'inspire du bel article de Rozenfeld et al. [66], qui cherche notamment à 
savoir comment les taux des croissances des cellules constituant les villes se relient entre 
eux, et infirme dans leur cas la loi de Gibrat [32] • Quant à nous, nous cherchons à savoir si, 
en terme de données électorales, les zones urbaines peuvent se concevoir comme des cellules 
indépendantes ou non. La cellule élémentaire s'identifie alors à l'espace géographique que 
circonscrit le bureau de vote considéré. Cette étude analyse plus finement les corrélations 
spatiales entre bureaux de vote à courte distance (voir figs. [3] et [H]), voire même aux bu- 
reaux à l'intérieur d'une seule commune, et convient particulièrement de par la méthode 
utilisée aux zones fortement peuplées. 

Pour des raisons de clarté, les calculs s'effectuent ici sur des disques de rayon r d = 8,0 km 
autour d'une commune centrale a, plutôt que sur des zones V" 6 constituées jusqu'alors de 
ses n p = 16 plus proches communes. (Par souci de cohérence aux sections précédentes, 
nous convenons de la distance r d = 8,0 km, puisque cette distance donne en moyenne 
16, 6 communes autres que la commune centrale à l'intérieur de ces disques.) De plus, par 
souci de clarté, ici les résultats électoraux (ou les taux de participation) de la commune 
centrale a se rajoutent à ceux de ses plus proches communes. 

Chaque zone considérée autour d'une commune a contient n" bureaux de vote : la 
somme des bureaux de vote de la commune centrale et des bureaux de vote des communes 
à une distance r ^ r d de la commune centrale. Rappelons au passage que les données 
dont nous disposons n'indiquent pas les coordonnées spatiales des bureaux de vote, mais 
uniquement la position de la mairie de chaque commune. La surface réelle d'une zone 
définie comme il précède, qui s'identifie à la superposition des surfaces des bureaux 
de vote, diffère donc en toute rigueur d'un disque de rayon r d . Notons enfin que les 
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communes à population relativement faible ne contiennent qu'un seul bureau de vote, ce 
qui représente environ 83% des cas. 

Revenons à notre problème. La moyenne des résultats (ou des taux de participation) 
des bureaux vote à l'intérieur de la zone considérée de commune centrale a s'écrit alors 
comme 

Hr (3=1 

où (3 désigne l'un des n" bureaux de vote, et t 13 son résultat électoral (ou son taux de 
participation). 

Calculons l'écart-type des r" ayant sensiblement le même nombre n" de bureaux de 
vote. Autrement dit, à l'intérieur d'un échantillon des t" ayant environ les mêmes 
déterminons l'écart-type des r", noté A[ Tr ]| n . En écrivant r fl = Tq + rf \ il vient 

(^jM(^) 2 xy.£>f>| n . (d-2) 

r (3=1 7=1 

Parmi les différentes possibilités, traitons au préalable les deux cas extrêmes : le cas 
des bureaux de votes indépendants et le cas des bureaux de vote complètement corrélés. 

• Bureaux de vote indépendants 

L'indépendance des bureaux de vote peut s'écrire simplement comme (r] l3 .r]' 1 ) = S^, 
où ô/3 y = 1 si (3 = 7 et autrement, et (...) représente la moyenne sur l'ensemble des r". 
L'équation ( 1D-2I) devient alors, 

A [7v] Loc^=. (D-3) 



• Bureaux de vote complètement corrélés 

Cette condition s'écrit ici comme (r] 13 .-)] 1 ) = pour tous f3 et 7. Il vient directement de 
l'équation (jD^jl : 

A [Tr] \ nr = este . (D-4) 

En terme d'accroissement de population, ce cas correspondrait à la loi de Gibrat, où la 
distance séparant deux cellules élémentaires n'a aucune importance. 

Préoccupons nous désormais d'un cas intermédiaire qui peut rendre compte des corrélations 
à longue portée (voir figs. [3] et ITTT) . 

• Décroissance de la corrélation des cellules élémentaires en loi de puissance 

Ce cas s'écrit alors avec un exposant d de la loi de puissance, comme 

2 

(W> ~ (D-5) 

où r/3 7 représente la distance qui sépare les bureaux de vote (3 et 7. (Il faudrait aussi tenir 
compte d'une longueur de coupure pour éviter des divergences pour les petites distances.) 
Pour les zones urbaines à forte population, i.e. ayant un grand nombre de bureaux de 
vote, nous pouvons utiliser le passage au continu de l'équation f]D-2[) . qui devient alors 
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pour ô < 2, en négligeant les effets de bord et en considérant la zone de surface Sj comme 
un disque de rayon r d : 



( A ïrr]\ n f ~ — / 
U r JS d 



a\ jidrdÔ 1 tfn (r d ) 



2-d 



r d n r 2 — d 



(D-6) 



où a = oc -r^ 



vient alors que : 



désigne la densité moyenne de bureau de vote par unité de surface. Il 




1 



(D-7) 



Notons que les deux cas extrêmes précédents se retrouvent ici : le cas des bureaux de vote 
complètement corrélés, avec d — 0, et le cas des bureaux de vote indépendants, avec d = 2 
— i.e. la dimension d'espace du problème considéré, ici une surface de dimension spatiale 
2. Avec un exposant d > 2, les corrélations deviennent non relevantes et se confondent 
alors avec le cas indépendant. 

Les figures [ED tracent A[ Tr ] | en fonction de n r pour les résultats électoraux (et pour 
les taux de participation), avec un minimum d'environ 180 r r ° par échantillon. En outre, 
leur fenêtre visualise A[ Tr ] en fonction de n r pour les bureaux de vote de la commune 
centrale uniquement. Les 6000 communes environ concernées pour le tracé des fenêtres 
—les communes qui possèdent plus d'un bureau de vote— se répartissent alors dans des 
échantillons de taille d'environ 120 au minimum. Afin de mieux percevoir le cas des bu- 
reaux de vote indépendants, nous ajoutons une courbe issue du mélange des résultats 
électoraux (ou des taux de participation) des bureaux de vote de l'élection de 2007-b. 
Qu'en déduire donc ? 

Les taux de participation des bureaux de vote, de la seule commune centrale ou des 
communes à l'intérieur d'un disque de rayon r d = 8, km, montrent une forte corrélation 
—bien que différente du cas complètement corrélé. Un peu plus quantitativement, pour les 
bureaux de vote de la seule commune centrale où l'équation < XD-7\i s'accorde relativement 
bien aux données, l'exposant de la décroissance des corrélations des bureaux de vote (voir 
Eq. ( 1D-5I) ) vaut en moyenne d ~ 0, 5 sur l'ensemble des 8 élections. (Le cas complètement 
corrélé aurait donné d = 0, et le cas complètement indépendant, d = 2.) 

Quant aux résultats électoraux des bureaux de vote à l'intérieur d'une seule commune 
centrale, ils vérifient relativement bien le cas complètement corrélé, excepté pour l'élection 
de 2000. Les résultats électoraux des bureaux de vote à l'intérieur d'un disque de rayon 
rrf =8,0 km s'éloignent sensiblement du cas complètement corrélé pour se rapprocher 
légèrement du cas indépendant, excepté pour l'élection de 2005. Cette dernière élection 
présente, de nouveau, un aspect nettement non trivial et en dehors des schèmes usuels. 
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E Réfutation du RFIM avec imitation du choix des 
agents 
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FlG. E-l — m a = /(m Vct ) d'après Eq. (|20p avec un champ uniforme F a = 
fonction de F donnant un équilibre stable en m* = 0, 6, ainsi que la pente 



F. A gauche, J en 



ce point d'équilibre. Le couple charnière avec lequel m* = 0,6 passe d'un équilibre simple à un 
équilibre multiple est (F ~ 0, 025; J ~ 1, 36). La pente vaut 1 pour le couple (F ~ —0, 23; J ~ 
1, 79). Figures du milieu et de droite : en pointillé, les droites y = x, x = et y = ; les points 
en étoiles indiquent une position d'équilibre instable, alors que les points en rond symbolisent 
une position d'équilibre stable. Dans la figure de droite avec F = 0,01, la position d'équilibre 
stable m* =0,6 est atteinte pour J ~ 1,39. 



Nous allons voir ici que les données permettent de rejeter le modèle RFIM basé sur 
l'imitation du choix des agents et exprimé par les équations (ÎT9j) ou (12Ô|) . Nous l'établissons 
en se servant d'une valeur particulière, < p a >~ 0, 8 soit < m a >~ 0, 6, obtenue pour 
les résultats de l'élection 2002-b, ou pour des taux de participation de plusieurs élections 
(voir Tabs. \KÂ\ et IA-41) . (Rappelons que m = 2p — 1 ou voir Eqs. (P, Œ3]).) Les simulations 
seront faites en utilisant p/3-, a donné par Eq. ( TTT1) . plutôt que par Eq. ( fï5il . afin de se 
rapprocher davantage de l'analyse théorique ; autrement dit, pour que la disparité de la 
répartition de la population ne modifie pas trop ce que prévoit une étude théorique. Les 
conclusions générales établies avec p^ a donné par Eq. f|T7|) seront ensuite vérifiées avec 
P/3-,a exprimé par Eq. ( fl~5l) . 

Considérons pour commencer un champ uniforme, F a = F sur l'ensemble des com- 
munes a. Les équations (1191) ou (I20p fournissent alors une valeur uniforme m = m a sur 
l'ensemble des communes a. Cette valeur, notée m*, indiquera par la suite qu'elle se 
réfère à un champ uniforme où f a = 0. La figure lÊViT -a trace à partir de l'équation ( J2fjl) 
les couples (F; J) (et avec J ^ 0) qui permettent l'existence d'un équilibre en m a = 
m Va = m* = 0, 6, ainsi que la pente de m a = f(m Va ) en ce point d'équilibre. Cette pente 

vaut f'(m Va ) = - — — = 2J.p[—F — J.m Va ], où p exprime la densité de probabilité des 

idiosyncrasies hi —ici, une gaussienne centrée réduite. Cette pente est inférieure à un en 
valeur absolue pour un équilibre stable. (Rappelons qu'au point critique, en F = 0, et 
m a = m Va = 0, cette pente vaut un, ce qui implique avec la distribution choisie des 
un J critique égale à J c = \/tt/2 ~ 1, 25.) 
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• Équilibre unique m* = 0, 6, avec J ^ 

Plaçons nous dans le cas où les paramètres (F; J) (voir Fig. lE-ll a) assurent l'existence d'un 
unique équilibre m* = 0, 6, et notons f'(m*) la valeur de la pente au point d'équilibre. Que 
se passe-t-il alors en présence des fluctuations f a ? Mieux, comment savoir si ce modèle 
avec ces paramètres s'accorde avec les données réelles des résultats électoraux et des taux 
de participation ? 

Pour répondre à cette question, nous utiliserons la valeur de la pente au point d'équilibre 
f'(m*). En effet, elle permet de connaître qualitativement si les corrélations sont à longue 
ou courte portée : plus la pente s'approche de un, plus les corrélations spatiales doivent 
avoir une longue portée, comme au point critique. D'autre part, les pentes des courbes 
empiriques donnant les valeurs moyennes de r Q en fonction de Tq (voir Figs. HJ-a et fT2l-a) 
devraient être approximativement égales à la valeur de f'(m*). 

Pour le démontrer faisons un développement limité au premier ordre de m Va autour 
de m*. Avec m Va = m* + ôm Va et Eq. (1151) . il vient m a = m* + ôm a ~ 2 J.p[— F — Jm* — 
f a ].Sm Va . En prenant la moyenne des m a sur un échantillon ayant le même m Va et en 
considérant des fluctuations f a pas trop grandes (i.e. 07 assez petit), il en découle 

< ôm a > \ mVa ~ f'(m*).ôm Va . (E-l) 

Or les pentes empiriques valent approximativement un, alors qu'avec un équilibre unique 
en < m a >~ m* = 0,6, f'(m*) < 0,76 (voir Fig. lE-lj -a). (Le passage des grandeurs 
m = 2p — 1 aux grandeurs r = ln(j3^-) n'affecte pas la valeur de la pente.) Des simulations 
numériques, non montrées ici, confirment nos affirmations et mettent en évidence des 
corrélations des m a faibles et à courte portée. 

Ainsi, dans le cas de la présence d'un équilibre unique en m* = 0, 6, le modèle du 
RFIM avec imitation du choix des agents ne permet pas de retrouver les mesures empi- 
riques. Étudions alors le cas où existent des équilibres multiples, dont l'un proche ou égal 
à < m a >= 0,6. 

• Équilibre double avec une pente f'(m* = 0, 6) = 1 

Pour F ~ —0, 23, J ~ 1, 79 et en l'absence de fluctuation f a , au point d'équilibre m* = 0, 6 
la pente de m a = f(m Va ) prend la valeur convenable et précédemment recherchée de 
f'(m*) ~ 1 (voir Fig. IE-11 -a). Mais ce point d'équilibre est clairement instable (voir fi- 
gure EzU-b), à moins que toutes les communes vérifient initialement m a (t = 0) > 0,6, 
condition initiale, semble-t-il, peu réaliste. L'équilibre stable se situe quant à lui à une 
valeur négative proche de —1 (cf. Fig. lE-ll -b). Même si les conditions initiales drastiques 
étaient respectées, pour oblitérer la présence de l'autre équilibre à m négatif, la présence 
des / a ^0 favoriserait la manifestation de l'autre équilibre à m < 0, et déstabiliserait de 
la sorte l'équilibre m* = 0, 6. (Il en irait quasiment de même avec des paramètres proches 
de ceux-ci.) Bref, la faible stabilité de m* = 0, 6 avec ce jeu de paramètres ne permet pas 
à ce modèle de sauver les phénomènes. 

• Équilibre double, avec F ^ 

Terminons alors par le cas où il existe un équilibre double, dont un, proche de m* = 0, 6, 
et ce avec F > de manière à favoriser naturellement cet équilibre stable plutôt que 
l'autre à m* < 0. La plage de F qui réalise ces conditions s'étend de F = à F ~ 0, 025 
en l'absence de f a (voir Fig. IE-11 -a). Dans un premier temps, analysons en détail ce qui se 
produit en F = 0,01. Les conclusions dégagées seront dans un second temps confirmées 
avec d'autres valeurs de F encadrant F = 0,01. Notons qu'avec F = 0,01, l'équilibre 
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FlG. E-2 - Simulations avec F = 0, 01, J = 1,4 dans Eq. (|2Ô|) . avec différents écarts-types Oj 
des f a et différentes conditions initiales (soit toutes nulles, soit de moyenne nulle et d'écart- 
type <7 m ( 4=0 ) =0,4). A gauche, les corrélations spatiales C(R) et à droite les histogrammes en 
grandeur p des m a simulés. 

stable m* = 0,6 s'obtient pour J ~ 1,39. Enfin, la figure lÊ^TI -c trace m a = f(m Va ) avec 
un champ uniforme F a = 0, 01 pour différents J. 

Le cas de l'existence d'un équilibre unique ayant été traité plus haut, la question 
qui se pose ici est de savoir comment la présence du second équilibre stable influe sur les 
corrélations et sur la distribution des m a . Pour répondre à cette question, nous faisons des 
simulations de l'équation (I2Ô1 avec F = 0,01, J = 1,4, mais avec différentes conditions 
initiales et écarts-types de f a . En effet, plus l'écart-type 07 des f a augmente, plus le 
second équilibre stable m* < se manifeste. Pour le comprendre qualitativement, d'après 
l'équation f[2"U]) . il suffit de remplacer m Va sur l'axe des abscisses de la figure lËVfl -c par 
{m Va + f a ). Quant aux conditions initiales des m a , elles peuvent favoriser un équilibre 
m* au détriment de l'autre. Nous choisissons ici deux types de conditions initiales afin de 
mieux mettre en lumière le rôle de <jj : la première où les m a (t = 0) sont tous nuls, et la 
seconde où les m a (t = 0) résultent d'un tirage aléatoire i.i.d. de moyenne nulle et d'écart- 
type cx m ( t= o) donné, égal à 0, 4 en l'occurrence. (Rappelons que la moyenne des f a est 
nulle.) Le second type de conditions initiales rend évidemment plus manifeste la présence 
de l'autre équilibre m* < 0. Les figures IËT21 reportent les corrélations spatiales C(R) des 
m a ainsi que les histogrammes en grandeur p = Ces histogrammes en grandeur p 

peuvent directement se comparer avec ceux des résultats électoraux (voir l'élection 2002-b 
par commune de Fig. IA-ip ou des taux de participation (voir Fig. IA-121) . 

Que nous apprennent principalement les simulations représentées à la figure IE-21 ? 
Premièrement, quand s'exerce la présence d'un seul équilibre m* (cf. les histogrammes 
de Fig. IE-21 avec 07 = 0, 1 ou 07 = 0, 2, avec pour ce dernier les conditions initiales 
m a (t = 0) = 0), les corrélations spatiales C(R) sont peu élevées et surtout de courte 
portée —ce qui confirme nos dires précédents relatifs au cas d'existence d'un équilibre 
unique m*. Deuxièmement, dès que la présence du second équilibre m* < se manifeste 
(cf. les histogrammes), les corrélations spatiales deviennent non seulement importantes 
entre proches voisins (cf. C(R~ 1)) mais aussi à longue portée. 

Comment comprendre ce dernier point ? Les deux équilibres m* se manifestent signi- 
fie qu'il existe des domaines dans lesquels tous les m a prennent des valeurs autour de 
l'équilibre m* > 0, et d'autres domaines dans lesquels tous les m a prennent des valeur 
autour du second équilibre m* < 0. Ceci explique la forte valeur des corrélations entre 
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proches voisins quand les domaines sont bien distincts. 

Nous pouvons retenir de cette analyse que le RFIM avec imitation de choix exprimé 
par Eq. (I19p peut engendrer des corrélations à longue portée et relativement fortes entres 
proches voisins pour une moyenne des p a bien éloignée de p = 0, 5 (comme par exemple 

< p a >~ 0, 7 pour a/ = 0, 3 et cr m (t=o) = 0, 4), mais en faisant apparaître de façon conco- 
mitante une distribution bimodale ou très élargie. 

Confirmons le point fort dégagé par l'analyse précédente —l'apparition conjointe d'une 
distribution bimodale ou très élargie et des corrélations à longue portée— par d'autres 
simulations, encore à F = 0, 01 mais avec différentes valeurs de J. En l'absence de f a , 
les courbes théoriques m a = /(m Va ) se voient à la figure lETTl -c. Les corrélations spatiales 
et les distributions obtenues par simulations numériques sont représentées à la figure IE-31 
pour plusieurs valeurs de J allant de 1,26 à 1,54, pour Of égal à 0,1, 0,3 et 0,4, et 
les deux types de conditions initiales utilisées plus haut. Notons qu'à F = 0,01, les 
équilibres multiples de m a = f{m Va ) en l'absence de f a apparaissent quand J > 1, 31, et 
que les histogrammes obtenus pour 07 = 0, 1 avec comme conditions initiales cr m ( t=0 ) = 
0,4 en coordonnées logarithmiques sur l'axe des ordonnées témoignent de la présence 
du second équilibre quand J > 1,42. (Les histogrammes des résultats ou des taux de 
participation des figures lï^Tïl et IA-121 ne laissent toujours pas percevoir de second équilibre 
en coordonnées logarithmiques sur l'axe des ordonnées.) 

Sans exploiter en détail les courbes de Fig. IE-31 elles corroborent l'assertion précédente : 
les corrélations à longue portée apparaissent pour une moyenne < p a > bien éloignée de 
p = 0, 5 avec la manifestation du second équilibre, élargissant par là même la distribu- 
tion des p a , la rendant clairement bimodale, ou bien très élargie. Remarquons néanmoins 
qu'avec une moyenne d'ensemble proche de p a = 0, 5, les corrélations à longue portée ap- 
paraissent sans nécessairement faire intervenir de deuxième équilibre, ou d'élargissement 
de la distribution des p a . Il suffit en effet de se placer proche du point critique (J ~ 1, 25, 
F ~ donnant < p a >~ 0,5). Mais toute cette étude se polarise sur les cas où les 
moyennes d'ensembles < p a > ne sont pas proches de p = 0, 5, et valent aux alentours de 
p = 0,8. 

Terminons cette partie en considérant comme nous l'avions dit plus haut, d'autres va- 
leurs de F dans la plage de à 0, 025. Plus F se rapproche de F = 0, plus la présence du 
second équilibre se manifeste facilement, et plus la distribution des p a devient facilement 
large ou bimodale —avec son corollaire de corrélations plus facilement à longue portée 
et à plus grande valeur entre proches voisins. Ici aussi il devient impossible de générer 

< p a >~ 0, 8 avec des corrélations à longue portée sans distribution des p a bimodale ou 
large. Des simulations effectuées pour F = 0, 0001 (non montrées ici) le confirment. Par 
contre, quand F augmente, la portée des corrélations tend à s'estomper par rapport à 
celles obtenues pour F = 0, 01, ce qui s'explique aisément par un plus grand éloignement 
du point critique. Idem, des simulations réalisées pour F = 0, 02, non montrées ici, l'at- 
testent. 

• Conclusion 

Le modèle RFIM avec imitation du choix des agents écrit à l'équation (12T)]) contient quatre 
paramètres libres : l'intensité de l'imitation J, le champ global appliqué F, l'intensité des 
fluctuations des tendances propres des communes 07 et la longueur caractéristique l c de la 
portée des imitations. En plus de ces quatre paramètres, les conditions initiales peuvent 
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influer sur les solutions fournies par le modèle. Nous avons fait agir dans cette annexe 
chacun de ces éléments excepté l c . Mais son influence est minime, comme le confirment 
d'autres simulations. Nous pouvons arrêter ici les tentatives pour obtenir des simulations 
en accord avec les résultats (ou les taux de participation) des élections de moyenne na- 
tionale < p a >~ 0, 8. 

Les simulations faites avec p^ a donné par Eq. (115j) confirment les conclusions ci- 
dessus. Par contre, elles font apparaître plus facilement —à des valeurs de J plus faibles 
que les précédentes et à champ F égal— des histogrammes très élargis ou bimodaux. 

Nous pouvons donc conclure l'impossibilité au modèle RFIM avec imitation du choix 
des agents de générer simultanément : des corrélations à longue portée des p a , une moyenne 
d'ensemble proche p = 0, 8 et une distribution des p a non bimodale (ni très large). L'ex- 
plication provient de l'éloignement de la moyenne finale < p a >~ 0,8 du point critique 
du modèle en p = 0, 5. 

Ce modèle ne peut sauver les phénomènes, il doit donc être rejeté. 
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FlG. E-3 — Corrélations spatiales et histogrammes tirés des simulations avec F = 0,01 dans 
Eq. (f2Ôj) . avec J allant de 1,26 à 1,56, <jf égal à 0, 1, 0,2 et 0,4, et les conditions initiales des 
m a , soit tous nuls, soit de moyenne nulle et d'écart-type a m r t=0 -\ = 0,4. 
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F Passage au continu et conditions de stabilité du 
modèle à tendances communales statiques 



L'équation (1331) résulte de l'état d'équilibre de l'équation linéaire 

u {i) =K.F Va {t)-F a {t) + f a . (F-l) 

(XL 

Notons que l'étude du modèle correspond aux états d'équilibre du modèle —comme 
nous l'avions fait pour le précédent modèle RFIM avec imitation des choix— sur lesquels 
une analyse générale peut être établie. Tenir compte des solutions transitoires, avec en 
prime les conditions initiales qui les sous-tendent, alors qu'un équilibre existe, complique- 
rait énormément l'étude et la perdrait dans les méandres de l'ensemble des cas particuliers. 

L'état d'équilibre du système correspond à l'ensemble des équations (1F-1I) appliquée 
à toutes les communes centrales a ; ce qui pourrait donner lieu à une écriture matricielle. 
Mais l'ensemble de ces équations se prête à une écriture relativement simple en utili- 
sant la grandeur spatiale continue r. Il est important de remarquer que l'espace, le terri- 
toire français sur lequel vivent les habitants répartis en diverses communes, est considéré 
comme une surface plane de dimension deux, et localisé comme précédemment par les 
coordonnées XY (longitude et latitude). Nonobstant l'hétérogénéité de la répartition de 
l'ensemble des communes, le passage au continu se simplifie encore. En adoptant alors une 
répartition homogène des communes si p^ a provient de Eq. (ÎT71) (avec une répartition 
également homogène de la population si p$-, a l'équation (TT3|) définit pp^a), et en utilisant 
l'équation (1341) pour F Va , l'équation ( 1F-1I) s'écrit alors comme 



r — r 



fdr' 



e 



L'expression linéaire ci-dessus fait intervenir un produit de convolution. Il convient 
donc d'utiliser les transformées de Fourier pour la traiter plus facilement. Question nota- 
tion, g(k, t) désigne de façon générale la transformée de Fourier de g(r,t) à deux dimen- 
sions, avec la convention suivante : 

9{r > t)=7 L S dkeîk ' r ^ k '^ ' ( p - 3 ) 

£(k,t) = i- J dre- îk r sM) • (F-4) 
L'équation ( 1F-2I) s'écrit avec les transformées de Fourier, comme 



où q = k l c est une grandeur sans dimension. 

L'équation précédente se comprend plus facilement par le traitement des cas limites. En 
notant A = , K ^, 9 — il , il vient A — > — |q 2 K — (l — K) et A — > —1. Nous retrouvons 

L(l+q2)3/2 g<<1 2^ V ) g>>1 

donc pour les grandes distances à l'échelle de l c , i.e. pour les petits vecteurs d'onde (k <S 
t-), le Laplacien de F(r,t). (La transformée de Fourier du Laplacien à deux dimensions 
donne — k 2 .) Ce résultat était prévisible, au coefficient —inopérant ici— |/ 2 près. En effet, 
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le membre de droite de l'équation (IF-ip s'écrit comme K(F Va — F a ) — (1 — K)F a + f a . 
Or, F Va réalise une sorte de moyenne des F$ au voisinage de la commune centrale a, ce 
qui permet de concevoir à son tour (F Va - F a ) comme une sorte de Laplacien. Quant aux 
petites distances à l'échelle de la distance caractéristique l c , i.e. pour les grands vecteurs 
d'onde (k ^> r-), le voisinage de F(r,t) n'intervient pas. Ce qui impliquerait à lui seul et 
en remontant à l'équation discrète (1F-1I) . que F a soit égal à f a . 



• Conditions de stabilité 

Revenons à la stabilité du modèle, qui ne dépend pas de la façon dont les communes (ou 
la population) se répartissent sur le territoire. Les solutions de l'équation (1F-5I) convergent 
à temps long quand 

(ï+^)57ï ~ 1 < ' < F " 6 > 



y = -K/(l+q ) _ 



modes instables 



Ainsi, les solutions sont toujours 
stables pour K < 1. L'instabilité ne 
peut se produire que pour K ^ 1, 
et pour les modes adimensionnés q ^ 
q* = V 'K 2 / 3 — 1. Le premier mode in- 
stable apparaît à K — 1 avec q = 0, 
i.e. pour une solution F(r, t) spatiale- 
ment uniforme. Enfin, pour K > 1, le 
mode uniforme q = reste d'ailleurs 
le mode le plus instable (celui pour le- 
quel [ ( 1+ ^2)3/2 — l] es t positif et de plus 
grande valeur) comme le montre la figure 
ci-contre. Remarque : L'assimilation de 

F a ) à un Laplacien effectif, partage les mêmes critères de stabilité ci-dessus, à la 
valeur de k* près. 

Considérons maintenant le cas limite K = 1 avec k = 0. Puisque (F Va — F a ) peut être 
assimilé à une sorte de Laplacien (cf. discussion ci-dessus), l'équation flïïïïl) se comporte 
comme une sorte de diffusion en présence de sources fixes : l'ensemble des f a . La solution 
à temps long n'est alors stable qu'à la condition où 




0. 



(F-7) 



Cette condition de stabilité peut se concevoir par analogie de la diffusion thermique en 
présence de sources internes de chaleur, l'ensemble des f a en l'occurrence. Ceci se retrouve 

dF(0,t) 



mathématiquement. Avec K — 1 et k — 0, l'équation (1F-5|) devient 



dt 



/(0). Or 



/(k) = ^ J2 a f a ■ e îk r " a puisque /(r) = J2 a f a . S(r — r Q ), où ô dénote la fonction de 
Dirac et r a la position de la commune a. F(0,t) ne diverge pas que si /(0) = J2 a f a est 
nul. 

En résumé. L'équation (1331) du modèle discuté, admet des solutions stables pour K < 1. 
Les solutions deviennent instables pour K > 1, et avec le mode spatial uniforme (i.e. 
k = 0) comme mode le plus instable. Pour K — 1, l'équation devient de type diffusif, et 
le système n'est stable qu'à la condition J2 a f a = 0- 



128 



G L'interaction entre communes testée avec le modèle 
des tendances communales statiques 

Cette annexe se propose de comparer trois types d'interaction entre agents de différentes 
communes, et ce sur la base du modèle des tendances communales statiques. 

Nous exposons dans un premier temps une méthode utilisée pour tester le modèle à 
tendances statiques, puis nous l'illustrons avec l'une des trois formes de connexion entre 
communes, avant de comparer entre elles les trois formes d'interaction entre communes. 
Enfin, nous terminerons cette annexe par une brève discussion. 

• Méthode suivie 

Le modèle statique donné par l'équation ( Î33l) attribue la valeur F a d'une commune en 
fonction des valeurs d'autres communes (regroupées dans F Va ), d'un coefficient K et 
d'une tendance spécifique fixe dans le temps, f a , inhérente à la commune a. F a est une 
grandeur mesurable puisqu'elle est directement liée au résultat électoral (ou au taux de 
participation) de la commune a comme le montre Eq. (13Ô1) . d'où la relation : 

F a = -y/2 erfc ( ~ 1) (2p Q ) , (G-l) 

avec une distribution gaussienne des idiosyncrasies individuelles hi. (Comme nous l'avons 
déjà évoqué, avec une distribution des hi de nature logistique, F a ex r a .) F Va dépend de la 
façon dont les agents de la commune a sont connectés —en termes d'influence sur le choix 
du vote ou de la participation, à l'élection considérée— par les agents d'autres communes 
f3. Dit autrement, la manière dont une commune (3 influence les agents d'une commune a 
est transcrite par le coefficient pp^a, et se retrouve dans F Va . Le modèle est satisfaisant 
s'il se suffit à lui même, autrement dit s'il parvient à retrouver les phénomènes observés 
avec un minimum d'ingrédients. Dans ce cas, le modèle est satisfaisant si les tendances 
propres des communes sont décorrélées entre elles. Le cas contraire extrême, où chaque f a 
dériverait directement du seul résultat électoral (ou du taux de participation) p a , n'aurait 
aucune valeur explicative puisque toute l'information serait contenue dans le champ des 
f a — i.e. du champ des p a en l'occurrence. En d'autres termes, un modèle convenable 
parvient à retrouver les phénomènes réels avec un minimum d'information, soit ici avec 
l'ensemble des f a le plus simple possible, i.e. le moins corrélé possible. 

Voyons maintenant comment mettre à profit les commentaires précédents, de manière 
à comparer différentes expressions de pp^ a - La pertinence du modèle réside ici dans la 
corrélation spatiale des f a : nulle pour un modèle parfait, égale à la corrélation des p a 
avec un modèle qui ne sert à rien. Tout ce qui suit consistera donc à estimer la tendance 
spécifique f a par commune a à partir de l'ensemble des résultats électoraux (ou des taux 
de participation), puis de calculer les corrélations spatiales des f a . 

Considérons une élection donnée. Le résultat électoral (ou le taux de participation) réel 
p a détermine F a de chaque commune en utilisant l'équation ( 1G-1I) . De l'ensemble des F 13 
des communes (3 7^ a et de l'expression de pp^ a , il se déduit F Va d'après l'équation (jMj). 
Noter que p^ a dépend d'un paramètre, l c , s'il ne dépend que du voisinage (cf. Eqs. (IT71 
[Toi) , ou d avec la connexion de type gravité étendue (cf. Eq. (|2*T1) ). Ainsi, F Va = F Va (l c ) 
(ou F Va = F Va (d)). Ensuite, f a s'évalue d'après l'équation ( 133|) en fonction de F a , de 
F Va (l c ) (ou de F Va (d)) et de K. Autrement dit, les données réelles des élections permettent 
d'évaluer la tendance propre f a (K,l c ) (ou f a (K,d)) associée à chaque commune a, en 
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fonction des deux paramètres libres du modèle adopté, K et l c (ou K et d). Ceci permet 
ensuite de déterminer, parmi tous les couples testés, le couple de paramètres qui minimise 
la corrélation spatiale des f a . Ce qui détermine le couple de paramètres du modèle avec 
la forme de voulue, qui convient le mieux à une élection donnée. 

Notons que cette méthode, qui consiste dans un premier temps à calculer les ten- 
dances spécifiques estimées en fonction des paramètres du modèle et des données réelles, 
puis, dans un second temps, à mesurer le degré d'indépendance des tendances spécifiques 
estimées, convient à ce modèle. En effet ce modèle linéaire ne comporte ni de solutions 
doubles, ni de point critique. Ainsi, f a s'obtient de façon univoque à partir des paramètres 
du modèle et des données réelles. L'inexistence de point critique évite d'introduire un biais 
possible dans la valeur des corrélations. 

Élaborons maintenant une sorte de facteur de qualité Q, qui nous permettra de com- 
parer les trois formes de connexion pp^> a testées. 

• Facteur de qualité 

Prenons l'exemple du cas où pp-* a provient de l'équation (fTTj) . Appelons C(k,i c ) ( r ) la 
corrélation spatiale de f a (K,l c ) à la distance r réelle (cf. Eq. (0) et section l2.1.5p . La 
corrélation s'effectue à l'intérieur des couronnes n, telles que r e]2 n D; 2 {n + 1) D], et se 
note C(K,i c ){n). (La distance D = 3 km, fixe ici, correspond environ à la distance séparant 
deux plus proches communes. A noter que dans Eq. ([5]), D dépend du département où se 
situe la commune a et vaut en moyenne environ 2, 7 km.) 

La corrélation spatiale des tendances spécifiques évaluées, f a (K, l c ) doit être comparée 
à la corrélation des données réelles F a , et ce afin de mesurer la qualité apportée par le 
modèle sur l'élection considérée avec le couple de paramètres libres (K,l c ). Notons, de 
la même façon que ce qui précède, C{n) la corrélation spatiale des F a à l'intérieur de la 
couronne n. Définissons le facteur de qualité Q(K,i c )( r max), la somme sur n max couronnes 
(où r max = 2 n max D) des valeurs absolues du rapport entre les corrélations estimées 
C(k,i c ) (n) et les corrélations des données brutes C{n), soit : 

n=l ^ ' 

Q(K,i c ){r max ) = 1, signifie que le modèle n'apporte rien. Plus Q( K ,i c ) (w) est petit, 
meilleure est la qualité du modèle pour l'élection considérée, et avec le couple de pa- 
ramètres {K, l c ) pris en compte. 

La figure IG-ll montre Q(K,i c )(r max ) pour les résultats et les taux d'abstention de 
l'élection 2007-b, avec n max = 16 (i.e. jusqu'à une distance r max = 96 km), et avec le 
type d'influence d'une commune (3 sur un agent de la commune a défini par Eq. (TTTj) . 
Le couple (K,l c ) qui minimise Q(x,« c )( r max) est celui qui explique au mieux l'élection 
considérée, en adoptant le modèle statique et la forme de P/3^ a voulue. 

Nous avons testé la fiabilité de la méthode, en simulant les F a à partir du modèle 
statique, et avec des couples (K, l c ) connus. Les F a simulés ont été ensuite bruités, au- 
trement dit un bruit additif rj a , i.i.d., s'est rajouté aux F a simulés. Nous avons cherché 
ensuite le couple qui minimise le facteur de qualité. Ce couple correspond à celui attendu 
(celui qui a servi à la simulation) dès lors que r max > 30 km. 

La figure IG-21 montre le couple (K, l c ) du modèle statique (avec pp^ a défini par 
Eq. ( TTTj) ) qui s'accorde au mieux à chaque élection, i.e. qui minimise Q(k,i c ) à une distance 
maximale r max donnée. Les couples (K, l c ) restent à peu près les mêmes pour une élection 
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FlG. G-l - Facteur de qualité Q(k,i ) obtenu pour T max — 96 km et pour l'élection 2007-b, 
avec le modèle à tendances statiques, et avec p/3-> a défini par l'équation (fTTl) , Ici, l c prend des 
valeurs jusqu'à 15 km, par multiples entiers de 1, 5 km quand l c > 3 km. Le couple qui convient 
au mieux à l'élection donnée, sous couvert du modèle considéré, correspond à celui qui minimise 
Q(K,i c ) ■ A gauche, l'élection 2007-b considérée pour ses résultats par commune, et à droite, pour 
ses taux de participation. 



donnée, si la distance maximale pour laquelle les corrélations des f a {K, l c ) pris en compte 
est telle que r max > 50 km. 

Comparons maintenant trois manières possibles d'exprimer l'influence d'une commune 
P sur un agent d'une commune a, et toujours sous le couvert du modèle des tendances 
communales statiques. 



• Comparaison des types d'interaction entre communes 

Plutôt que de chercher le couple particulier (K, l c ) qui correspond au mieux à une élection 
donnée selon le modèle utilisé, nous cherchons ici à comparer entre eux différents modèles. 
Ou mieux, nous testons trois variantes, qui portent sur le type d'interaction entre com- 
munes, au sein du modèle dit à tendances communales statiques. En d'autres termes, 
Pf3-, a , qui exprime la manière dont les agents d'une commune a interagissent avec les 
agents de la commune f3, pourra prendre trois formes différentes à l'intérieur de F Va . 

Peu nous importera donc de déterminer, selon le type d'interaction adopté, le couple 
particulier (K, l c ) qui minimise Q(K,i c )( r max) à r max donné. Notons alors Q(r max ), la valeur 
minimale de Q(K,i c )(r max ) obtenue pour le type d'interaction p/3-, a considéré et à r max 
donné. Autrement dit, Q(r max ), à r max donné, procure le meilleur facteur de qualité que 
la variante du modèle prise en compte puisse fournir à l'élection traitée. Plus petit sera 
Q(r max ), meilleure sera la variante du modèle, i.e. meilleure sera l'indépendance des f a 
—estimés selon la variante du modèle— pour l'élection traitée. La comparaison entre ces 
différentes variantes devient dès lors possible. 

Les figures IGÛ31 fournissent Q{r max ) pour trois types d'interaction pp^a, obtenus avec 
les résultats et les taux de participation des élections étudiées. Les interaction testées, 
exprimées par la forme de pp^ a dans Eq. (133|) . proviennent, soit de Eq. (fTTl) . soit de 
Eq. ([ISD, soit enfin de Eq. (T2Tj). 

Il ressort de ces figures que le mode d'interaction entre deux communes défini par 
l'équation (ÎTTj) procure le meilleur résultat au modèle des tendances communales sta- 
tiques. Et ce meilleur accord concerne aussi bien les résultats électoraux, que les taux de 
participation. (Seules les valeurs de Q obtenues pour r max > 50 km sont significatives, 
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FlG. G-2 - Couple (K, l c ) du modèle statique, avec pp-> a défini par Eq. (fïTj) . le plus approprié 
pour chaque élection, et à une distance maximale r max de prise en compte des corrélations des 
tendances spécifiques estimées, f a (K,l c ). A gauche, les couples obtenus pour les résultats des 
élections, et à droite, pour les taux de participation. 



comme il en a été déjà question ci-dessus, ainsi qu'aux figures R*T3l ) 

Pour vérifier la robustesse du test effectué, nous avons aussi calculé les corrélations des 
f? = sign[/ a — (/)], qui prennent la valeur ±1 selon que la tendance spécifique estimée 
f a d'une commune a est au dessus ou au dessous de la moyenne sur toutes les communes 
des f a . Ces nouveaux tests —avec la corrélation spatiale des /" plutôt que celle des f a 
comme précédemment— confirment les conclusions précédentes. 

Nous avons aussi fait un autre test en tenant compte des coefficients K a non lissés, 
tels qu'ils apparaissent dans les équations (j2"Bl et l2"5]) . Ces tests confirment de nouveau les 
conclusions précédentes. 

Faisons enfin le bilan de ces tests. 

• Résumé et discussion 

Fait notable, les couples de paramètres (K, d) qui conviennent le mieux aux données 
(aux résultats électoraux et aux taux de participation) selon la variante afférente à 
l'équation ( Î2TT) pour pp^ a , sont (K — 1; d = 10,5). Le fait que d soit égal à 10,5 (le 
plus grand exposant testé) est particulièrement remarquable puisque nous testions indi- 
rectement l'hypothèse d'une interaction restreinte au voisinage géographique, d — 10, 5 
est l'exposant testé qui accorde le plus de poids, ou d'importance, aux communes proches 
de celle où réside l'agent considéré. Ainsi, l'hypothèse d'une interaction locale n'est pas 
contredite à ce stade. 

Nous avons aussi comparé les facteurs de qualité Q obtenus à partir d'une distribution 
logistique, et ceux obtenus à partir d'une distribution gaussienne —utilisée jusqu'alors— 
et avec p^ a provenant de Eq. ([17]) . mais nous n'y avons rien vu de notable. 

En résumé, les tests effectués sur le modèle des tendances communales statiques ont 
mis en évidence les deux points suivants. Premièrement, des trois variantes testées, celle 
qui convient le mieux correspond à l'équation ( ÎT71) pour pp^a, et est appelée influence 
indirecte via les lieux de résidence. Deuxièmement, l'hypothèse d'une interaction locale 
ne semble pas être contredite. 
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FlG. G-3 - Facteur de qualité Q(r max ) obtenu à partir de trois formes d'interaction, pp-, a , 
entre communes, et toujours selon le modèle à tendances statiques. pp-> a exprimé par Eq. (fTTJ) 
procure les figures de gauche. Les figures du milieu proviennent de pp^ a écrit par Eq. (fTo]) . pp-> a 
prend la forme de Eq. (I2ip dans les figures de droite. Les figures du haut découlent des résultats 
des élections, tandis que celles du bas, des taux de participation. 



Néanmoins, ces conclusions sont sujettes à caution puisqu'elles ne sont rigoureusement 
valables que dans le cadre du modèle des tendances statiques. Bien que le facteur de 
qualité soit très petit —de l'ordre de 10~ 2 , ce qui nous semble encourageant pour un 
modèle simpliste—, nous ne pouvons tenir compte rigoureusement de ces conclusions que 
si le modèle convient. Quoi qu'il en soit, ces tests fournissent, a minima, des indications 
fortes dont nous tiendrons compte par la suite. 
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H Corrélations spatiales théoriques 



Cette annexe se donne pour tâche de tracer les corrélations spatiales des modèles à 
tendances communales statiques ou dynamiques, et ce analytiquement. Elle se fonde sur 
l'approximation d'une répartition homogène des communes, voire si nécessaire (dans le 
cas où est défini par l'équation (1T5"]) ). d'une répartition homogène de la population. 
Les corrélations proviennent du passage au continu des équations (I33H34I) déjà traité à 
l'annexe El 

Cette annexe reprend les mêmes notations et conventions concernant la transformation 
de Fourier que celles de l'annexe El 



• Modèle statique 

L'équation (1F-5I) admet pour solution : 

F(k, t) = [ dt' . e-C-OA* . /(k) + CI. , (H-1) 
Jo 

où CI désigne les conditions initiales, et le temps caractéristique du mode k, défini 
par : 

l = i- K m 2) 

(1 + (H c )2)3/2 ' 

qui contient les deux paramètres libres du système : K et l c . Remarquons au passage que 
les équations ci-dessus sont invariantes par rotation, ce qui est en accord avec l'isotropie 
du modèle. (F Va , de par sa définition, ne fait apparaître aucune direction privilégiée, et 
les communes sont uniformément réparties.) Nous nous plaçons dans la situation où les 
conditions initiales ne jouent plus aucun rôle afin d'étudier le modèle dans sa généralité 
—comme nous l'avions déjà discuté à l'annexe El 

La corrélation spatiale C(r, t) au temps t s'écrit comme : 

C(r,t) = Jàr 1 (F(T 1 ,t)F(r 2 = r 1 -r,t)) , (H-3) 

où (...) désigne la moyenne sur toutes les réalisations. 
En utilisant les transformées de Fourier, 

(F( ri ,t)F(r 2) t)> = -i- J dk 1 ,dk 2 .e^ + k ^K(f(k 1 )f(k 2 )).I(k 1 ,k 2 ,t) , (H-4) 

avec t t 

I(ki,k2,t)= [ dti / dt 2 . e - ( *"* l)/Tfc i . e- (t_ta)/7 Vi , (H-5) 
Jo Jo 

d'après Eq. (lÏLll . 

Les tendances spécifiques des communes s'écrivent comme /(r) = f a . S(r — r a ), 

où ô désigne la fonction de Dirac et r a la position de la commune a. La décorrélation 

des tendances propres des communes implique que (f a f?) = (/ a ) 2 5 Q( 3, où 5 a p dénote le 
symbole de Kronecker. Ainsi, 

(/(kO /(k 2 )) = j±y 2 J2(f a ) 2 ■ e-^^ a , (H-6) 
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ce qui permet d'obtenir C(r, t), après simplification, comme 



C(r, t) oc ^T(f* ) 2 J dk • e " k ' r • fc > *) > (H-7) 



où, d'après Eq. (1H-5I) . 



J(A;,fc,t) = (r fc ) 2 .(l-e-^) 2 — 4 = (r fc ) 2 . (H-8) 

f>T k 

Notons une fois de plus l'isotropie de la corrélation spatiale, évidemment en accord avec 
l'isotropie du modèle. 

De nouveau, nous nous nous plaçons après le régime transitoire. Ensuite, il ne reste plus 
qu'à normaliser la corrélation spatiale, soit plus précisément à diviser C(r) ci-dessus par 
C(r = 0). Il faut enfin tenir compte de la physique du problème, i.e. des dimensions réelles 
du système étudié : les communes de la France. La distance maximale qui intervient est de 
l'ordre de L = 500 km. La distance minimale sur laquelle porte une tendance spécifique 
uniforme, est de l'ordre de grandeur de la dimension de la commune, soit a = 2 km. Il en 
résulte, avec un changement de variable faisant intervenir le mode adimensionné q = k/ c , 
que : 

C(r) = c/ , , , (H-9) 

où 

k = (r q ?=ll- {i * q2f/2 y 2 . (H-10) 

Dans l'équation (1H-9I) ci-dessus, la distance r, possède la même unité que les distances l c , 
L et a. 

En résumé, dans l'approximation d'une répartition uniforme des communes, voire 
d'une répartition uniforme de la population si nécessaire, la corrélation spatiale C{r) s'ob- 
tient analytiquement par Eq. ( 1H-9I) . où I q provient avec ce modèle de l'équation ( 1H-10I ). 
(Les figures fT6l tracent ces corrélations pour différentes valeurs de K et de l c .) 

• Modèle dynamique 

Cette partie suivra la même démarche que celle qui traitait du modèle statique. 

La différence par rapport au modèle précédent concerne les tendances propres des com- 
munes : précédemment fixes et décorrélées entre elles, ici elles deviennent non seulement 
décorrélées entre elles, mais aussi fluctuantes au cours du temps (cf Eqs. (I37H38P ). Autre- 
ment dit, les tendances spécifiques deviennent du modèle statique au modèle dynamique, 
j-a _^ e t en transformée de Fourier, /(k) — > /(k, t). 

Ainsi, F(k, t) devient en modèle dynamique, et en négligeant les conditions initiales : 



F(k, t) = I dt' . e -(*-*')A* . /(k, t') , (H-li; 
Jo 



où Tk garde la même forme que celle donnée à l'équation ( 1H-2I) . Ceci implique que 
l'équation ( 1H-5I) devienne avec le modèle dynamique : 



I(h, h, t) = [ dh [ dt 2 . e -(*-*0/**i . e -(*-*a)/^ a . S(ti - t 2 ) , (H-12) 
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d'où, 

I(k,k,t) = K k . (1 - e~ 2t/Tk ) — > I k <XT k . (H-13) 

Z £»Tfc 

Ainsi, la corrélation C{r) s'obtient de nouveau par l'équation ( 1H-9I) . mais avec ici : 

/ «=^=t 1 -(n^p]" 1 - (H-i4) 

En résume, avec l'approximation d'une répartition uniforme des communes, ou d'une 
répartition uniforme de la population si nécessaire, la corrélation spatiale C(r) s'obtient 
analytiquement de nouveau par Eq. (1H-9I) . mais avec I q qui provient de Eq. ( 1H-14I) en 
modèle dynamique. (Les figures fT8l tracent ces corrélations pour différentes valeurs de K 
et de l c .) 



Notons enfin que si l'amplitude moyenne des fluctuations des tendances spécifiques 
d'une commune, dépend de la commune considérée (voir Eqs. ( !39ti4Ô|) pour leur forme 
mathématique), l'équation ( 1H-12I) est inchangée. Ainsi, la corrélation spatiale C(r) de ce 
cas, garde la même forme que celle du modèle dynamique traité ci-dessus. 
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Autres travaux 



Compléments de Of Songs and Men : a Model for Multiple 
Choice with Herding 

Dans l'article [1J nous étudiions de façon semi- quantitative la très belle expérience de 
Salganik et al. [2]- Cette expérience, réalisée sur le web auprès de 14000 agents environ, 
essaie de mesurer la modification du choix opéré par la connaissance du comportement 
des autres agents (par rapport au cas neutre, où les agents n'ont aucune connaissance 
des choix des autres agents). Le but principal poursuivi par [T] était de mesurer —dans le 
cadre d'un modèle donné— lors de la prise de décision d'un agent, l'intensité de la prise 
en compte du choix des autres agents. Nous voulions évaluer, dans deux cas concrets et 
issus des expériences, une grandeur J relative au terme d'interaction aux choix des autres 
agents, et ce selon un modèle adopté de prise de décision. 

Notre étude utilisait le formalisme du modèle d'Ising en champ aléatoire à température 
nulle (plus connu sous sons acronyme anglais de Random Field Ising Model, RFIM, à T), 
non pas dans le cas usuel d'un choix binaire, mais dans le cas des choix multiples. Nous 
essayions de façon semi-quantitative de mesurer l'intensité d'interaction, J, du couplage 
d'un agent au choix des autres agents. Semi-quantitative, car au moment de l'étude, nous 
ne disposions pas des données de leur expérience, mais uniquement de leur article et du 
complément d'information afférent parus dans Science. 

Les données relatives à ces expériences sont maintenant disponibles [3] . Indiquons aussi 
que la thèse de Matthew Salganik |4| détaille les expériences décrites dans [2], ainsi que 
d'autres réalisées sur le même thème. 

Dans la partie qui suit nous nous référons à pQ. Non pas pour l'écrire autrement, mais 
pour revenir sur certains points et apporter quelques développements supplémentaires. 



Le terme d'interaction de l'équation (5) 

Nous détaillons ici une façon de parvenir au terme JM{<p a (t) - ±), 

qui traduit sur 

un agent i et sur la chanson a, le couplage aux choix des agents qui le précèdent. 

Nous partons pour cela du couplage usuel des spins (à deux états S = ±1) en champ 

y, N - s- 

moyen, î.e. 

J N^- N ° US 

pouvons considérer cette interaction comme une comparaison 
entre toutes les alternatives possibles. Ici, les alternatives, ou les différents choix possibles, 
sont au nombre de deux, et de plus exclusives. Autrement dit, l'agent j prend l'un des 
deux choix 7 = ±1, et de façon exclusive : s'il opte pour le choix 7 = + (i.e. Sj = +1), 
= 1 et nj = 0, et s'il opte au contraire pour le choix 7 = — (i.e. Sj = —1), nj = l 
et = 0. Le terme d'interaction d'un unique choix binaire en champ moyen s'écrit alors 
comme 



J - = J 



Le passage à une comparaison entre M choix binaires possibles —mais cette fois ci, 
non exclusifs— devient alors pour l'un des choix a : 



J 



2^j=l 2^/3=1 n 3 
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où 7ij = 1 si l'agent j a pris la position « + » (d'acheter, télécharger, voter, etc.) « l'objet » 
(5 (le produit, la chanson, le candidat, etc.), et inversement (puisque le choix est binaire), 
m?- = 0, si l'agent j opte pour la position « — » (de ne pas acheter, de ne pas télécharger, 
de ne pas voter, etc.) pour (3. 



Avec les notations de pQ, Eq. (_2J s'écrit alors comme JM(0 a (t) — -g). 



Détermination du point critique 

Nous voulons déterminer ici la valeur J c de l'intensité de couplage J au point critique. 
Introduisons deux nouvelles grandeurs, d'une part x a la proportion d'agents ayants 
choisis « l'objet » a, soit 

^^P". (3) 

et d'autre part la proportion x « d'objets » choisis sur la totalité des « objets » qui auraient 
pu être choisis, soit 

X M NM ' y ' 

Autrement dit, en utilisant la notation de l'équation (5), M<p a = et avec la consom- 



c 

NM' 



mation totale C de l'équation (4) : x 

D'après l'équation (5) et avec les nouvelles notations, la probabilité que l'agent i 
choisisse (achète, télécharge, vote, etc.) « l'objet » a s'écrit comme 

P[nnt) = l]=V[(5h? + b i )>-F«-J(^-l)] . (5) 

En passant à la limite continue (i.e. en prenant un nombre « d'objets », M — > oo, et un 
nombre d'agents, N — t — » oo), avec une distribution normale réduite des idiosyncrasies 
Shf décorrélée de la distribution des 6; (gaussienne de moyenne nulle et de variance S 2 ), 
les points fixes x s'obtiennent avec 

où F = mp + f. (Rappel : mp est la moyenne des F a , et représente l'attractivité moyenne 
des produits, une sorte de potentiel chimique qui détermine le nombre moyen « d'objets » 
choisis.) 

dx 



Au point critique, où J = J c et x — Xc, tt "~ > 00 • De l'équation ( 6 ). il vient alors 

df 



J c = Xc2 y/2(l + E2) ( - erfc(- 1 )'(2x)) . (7) 

v / max 

Or la dérivée de la fonction inverse de erfc, est maximale en 2x = 1, et vaut alors — 2 Ç-. 
On en déduit donc que le point critique se situe toujours en x c = |, et l'intensité de 

couplage critique vaut 

J c = Xc V2vr (1 + S 2 ) . (8) 



Xc, défini par Eq. ( j 4 j) . se détermine ensuite analytiquement à partir de l'équation 
auto-consistante : 
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-+oo 

Xc = I dFp F (F)x(J c , X c,F) , (9 

-oo 



où pf dénote la densité de probabilité des F = rrip + f (i.e. une gaussienne de moyenne 
m F et de variance S 2 ). 



Coefficient d'imprédictibilité U, proche du point critique 

Deux équilibres stables peuvent coexister après le point critique. Une imprédictibilité 
U ^ apparaît donc naturellement après le point critique (i.e. pour J > J c ). En revanche, 
pour J < J c , chaque « objet » d'attr activité F = mp + f possède un unique équilibre 
stable (identifiable par son taux x), et ne laisse donc apparaître aucune imprédictibilité 
(i.e. U = 0). Précisons de nouveau que nous nous situons encore ici dans la limite continue 
M, N -> oo. 

Pour J > J c , les deux équilibres stables 
—pour un « objet » d'attractivité relative 
/ donnée— n'existent que dans la zone / G 
\f H f B [. De plus, Ub - Îh) ~ (J - J c ?>\ 
proche du point critique. 

De même, quand J > J c , il n'existe pas 
d'équilibre stable pour x €.}xb ; xh[- C'est 
l'une des propriétés du modèle qui pour- 
rait être facilement testée aux données, en 
vue de sa validation ou de sa réfutation. 
Précisons néanmoins, que le modèle ne 
possède cette propriété, ou cette signature, 
que dans le cas d'un passage au continu, 
qui nécessite à la fois que les agents et les produits soient très grands, voire tendent vers 
l'infini. Bref, proche du point critique, (xh — %b) ~ ( J — Jc) 1 ^ 2 - 

Calculons maintenant l' imprédictibilité U, proche du point critique. 

Nous devons d'abord modifier l'expression de U donnée dans [2] et reprise dans [I], afin 
que U soit indépendant du nombre du produits, M, et notamment qu'il ne s'effondre pas 
vers quand M — > oo. Dans ce paragraphe, nous utiliserons U = toj X/«Li Y^k=\ J2i<k l^(/c)~ 
(/)qs\ (i.e. nous multiplions par le nombre de produits M, la définition de U adoptée 
dans [HE])- (Rappel, U exprime la différence moyenne de comportement d'un même 
« objet », sur les W différents mondes.) 

Avec une probabilité | que chacun des équilibres stables soient atteints dans la zone 
/ e]/h /b[j il vient |0" fc ^ — oc (x + — où x + représentent les équilibres de la 
branche supérieure (x ^ xh), et inversement pour x_. Or, avec l'expression retenue ici 
pour U, il vient : 

U oc [ B df- (x+ -x-) . (10) 

Il ressort donc de ces calculs que l'imprédictibilité U, proche du point critique, se 
comporte comme 

r u~(j-j c ) 2 , j>j c r 

\ U = 0, J < J c { ' 
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Le choix en deux étapes de l'équation (11) 

L'expérience [2] indique que l'agent écoute d'abord une chanson avant de pouvoir la 
télécharger. Notons Af , la première étape, celle que l'agent i réalise pour choisir s'il veut 
écouter ou non la chanson a. La seconde étape, celle qui détermine si l'agent i télécharge 
la chanson a écoutée, se note comme . Ainsi, 

K = *? A? , ( 12 ) 

exprime, au final, le choix réalisé par l'agent i de télécharger la chanson a qui apparaît 
parmi les M chansons sur son écran d'ordinateur. (Rappel : le choix prend une valeur 
binaire, 1 si l'agent écoute ou télécharge, et dans le cas contraire.) 

Le choix Af , de l'agent i au temps discrétisé (t + 1), se modélise dans p]J comme 

Af = 6 [Shf +hi + F a + JM(r(t) - i) ] . ( 13 ) 

L'idiosyncrasie d'un agent i au regard d'une chanson a s'écrit comme hf = ôhf + hi, 
où les idiosyncrasies Shf sont décrites par une gaussienne centrée réduite, et hi par une 
gaussienne centrée d'écart-type S. L'attractivité F des chansons est représentée par une 
gaussienne de moyenne mp et d'écart-type E_f. A noter que l'attractivité moyenne des 
chansons, mp, peut aussi se comprendre comme un terme de contrainte imposée par une 
sorte de budget des agents, i.e. une quantité de chansons que peut écouter en moyenne 
un agent. Enfin, ôhf, hi, et F a sont décorrélés. 

Quant à la seconde étape, au choix de télécharger ou non la chanson a écoutée, il 
s'écrit le plus simplement possible et en se basant encore sur une modélisation de type 
RFIM, mais ici sans terme d'influence inter-agents : 

= e[^ a + F /Q ] . (il) 

L'idiosyncrasie h'^ d'un agent i à télécharger la chanson a écoutée se schématise de 
nouveau par une distribution gaussienne centrée réduite. L'attractivité F', qui décrit la 
possibilité des chansons écoutées à être téléchargées, se représente par une gaussienne 
de moyenne m' F et d'écart-type T! F . Enfin, b!^ et F' a , son t ind épendants entre eux, et 



indépendants aussi avec les différents termes de l'équation u 13 h afférente au choix de la 
première étape. 

Il est important de noter les deux hypothèses fortes suivantes. Premièrement, les deux 
étapes sont indépendantes l'une de l'autre. Deuxièmement, l'influence potentielle du choix 
des autres agents, ne se produit selon cette modélisation qu'à la première étape, et encore, 
que dans les mondes non « indépendants » (dits aussi sous influence sociale). Si nous avions 
disposé des données relatives aux expériences menées par Salganik et al. au moment où 
nous avions mené cette étude, nous nous serions cantonné à la première étape, puisque 
celle-ci fait directement intervenir l'information ou non du choix des autres agents. 

Etalonnage des paramètres dans les mondes « indépendants » 

La première étape, celle qui décrit le choix relatif à l'écoute des chansons (cf. Eq. (j 13 )) 



comporte 4 paramètres libres, à savoir, mp, S^, S et J. (Ce sont les 4 paramètres du 
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modèle développé dans pQ , écrit à l'équation (5).) La seconde étape, qui se réfère au choix 



de télécharger une chanson écoutée (cf. Eq. (1 14 [) ). contient quant à elle deux paramètres 



libres : m' F et E' F . 

Nous avions utilisé les expériences réalisées dans les mondes dits « indépendants » 
(dans |2J) pour déterminer tous les paramètres, excepté l'intensité J de prise en compte 
du choix des autres agents. L'attribution des valeurs de ces 5 paramètres libres du modèle 
s'effectuait, comme nous l'avions dit plus haut, de façon semi-quantitative. La tâche princi- 
pale de ce travail concernait la mesure de J, et ce par comparaison des expériences avec ou 
sans influence des autres agents. Mais pour cela, il fallait au préalable déterminer les autres 
paramètres libres du modèle, en se basant uniquement sur les mondes « indépendants ». 

La table S2 du supplément d'information de [2J indique pour les chansons écoutées par 
participant dans les mondes « indépendants »une moyenne (l) ~ 3, 8, ai nsi q u'une valeur 



médiane valant 1, et ce pour les expériences 1 et 2. D'après l'équation (1 13 I) . avec J = 
des mondes « indépendants » , il vient que la probabilité moyenne d'une chanson a d'être 
écoutée vaut | erfc ( ^"(î^s^ ) ) ' ^ U P reimer orcu ~e en E^, il s'en déduit pour l'ensemble 
des M chansons, que : 

gU^erfcf- , mF \. (15) 



M 2 \ ^2 (1 + E 2 ) 

Les couples (m F ; E) qui vérifient l'équation ci-dessus respectent donc le nombre, (l), de 
chansons écoutées en moyenne par les agents. Afin de respecter égaleme nt la bonne valeur 



médiane, nous avions eu recours aux simulations numériques de Eq. f ) 13 I) avec J = 0. 
Nous nous avions essayé plusieurs couples valeurs de S (m? provenant alors de Eq. ( 1 15 j) ). 
et avions mesuré ensuite la médiane obtenue des chansons écoutées. Par exemple, avec 
S = (i.e. avec une homogénéité des « budgets » des agents relatifs au nombre de chan- 
sons écoutables) la valeur médiane vaut 4, proche de la valeur moyenne; avec E = 1/2, 
la valeur la plus probable vaut 1, mais la vale ur m édiane vaut 3. Nous avions finalement 



retenu E = 1 (et donc m F ~ —2,0 selon Eq. (1 15 |) ). qui, à ce stade, s'accordent avec les 
données fournies par [2J. Noter que nous avions été obligé d'introduire le paramètre E 
relatif aux différentes propensions (ou « budgets ») des agents à pouvoir écouter un plus 
ou moins grand nombre de chansons, de manière à vérifier la valeur médiane expérimentale. 

Une chanson écoutée a une probabilité moyenne ^ d'être téléchargée, où (d) in- 
dique le nombre moyen de chansons téléchargées, (d) vaut environ 1, 1 dans le monde 
« indépendant » de l'expérience 1, et environ 1.5 pour celui de l'expérience 2 (cf. Tab. S2 
de [2]). De la même façon que précédemment, au premier ordre en E', il vient 

ï-ï-(-S)- (f6) 

L'équation ci-dessus permet donc de déterminer, directement, le paramètre m' F de cha- 
cune des deux expériences de [2] ; soit m' F ~ —0, 55 pour l'expérience 1, et m' F ~ —0, 26 
pour l'expérience 2. 

Il ne reste plus qu'à déterminer les écarts-types T, F et E' F . Ils s'évaluent en utilisant le 
coefficient de Gini, G (voir Eq. (7) de P), et le coefficient d'imprédictibilité U (voir Eq. (8) 
de pQ), tous deux, des mondes « indépendants ». Nous supposons pour simplifier que les 
deux écarts-types de l'attractivité des chansons correspondantes aux deux étapes sont de 



146 



O © Exp. 2 
O O Exp. 1 



O 
O 
O 



O-O Exp. 2 

° °' O G O O Exp. 1 



% ■<> ■<> A. Q - 
o o 



0,2 0,4 0,6 



FlG. 1 - Coefficient de Gini G (à gauche), et coefficient d'imprédictibilité U (à droite), en 
fonction de Sj? dans les « mondes indépendants » (J = 0). Avec les valeurs réelles de j2] : dans 
l'expérience 1, G ~ 0, 25, U ~ 0, 05, et dans l'expérience 2, G ~ 0, 2, {/ ~ 0, 04. 



même valeur, i.e. H F = T/ F . Cette hypothèse est certes arbitraire, mais les simulations 
numériques montrent que les résultats ne varient guère tant que et T/ F ne diffèrent 
pas trop entre eux. 

Les figures [l] montrent le coefficient de Gini G et le coefficient d'imprédictibilit é U 



en fonction de E_p, et ce dans les mondes « indépendants », i.e. avec J = dans Eq. 1 13 
(Bien évidemment, les valeurs de m F , S et m' F de chacune des deux expériences sont 
égales à ce qui a déjà été calculé ci-dessus.) Les simulations numériques ont été faites 
sur W = 8 mondes ayant les mêmes valeurs des F a et des F' a , répété à 8 reprises. Dit 
autrement, les simulations ont été réalisées pour 8 ensembles différents de F a et de F' a , 
et pour chaque ensemble de F a et de F' a : W = 8 mondes différents. La taille de chaque 
monde est iV = 700, comme en [2]. 

Il ressort de ces figures que ~ 0,2 dans les expériences 1 et 2. Les valeurs 
de G et de U correspondent alors, approximativement, aux résultats réels des mondes 
« indépendants » donnés dans [2]. A savoir dans l'expérience 1, G ~ 0,25, U ~ 0,05, et 
dans l'expérience 2, G ~ 0, 2, U ~ 0, 04. 

En résumé, le calibrage semi- quantitatif fournit m F = —2,0, S = 1,0 et = 0,2, 
pour la première étape des expériences 1 et 2 ; m' F = —0, 55, T! F = 0, 2 pour la seconde 
étape de l'expérience 1, et m' F = —0, 26, H' F = 0, 2 pour la seconde étape de l'expérience 
2. (Noter qu'entre les deux expériences, seul diffère m' F , lié à la probabilité moyenne de 
télécharger une chanson écoutée.) 

Deux J pour deux influences sociales différentes : quelques figures 
de plus 

Nous donnons ici quelques figures supplémentaires, afin de poursuivre la confrontation 
semi-quantitative avec l'expérience menée par Salganik et al. 

Dans [lj, nous avions montré que l'expérience 1 —à faible influence sociale— corres- 
pondait relativement bien à J\ = 0, 17, et l'expérience 2 —à plus forte influence sociale—, 
à J2 = 0, 30. Nous avions obtenu ces valeurs de J en traçant les coefficients de Gini, G, 
et d'imprédictibilité, U, en fonction de J. (Et toujours avec des simulations numériques 
dans les mêmes conditions que dans [2J.) Autrement dit, J est calibré en connaissant les 
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J. =0.17 




J =0.30 



C «J - 



FlG. 2 Coefficients de 
Gini, G, obtenus par simu- 
lation des expériences 1 (à 
gauche), et 2 (au centre). 
Cf. Fig. 1 de [2] pour les 
expériences réelles. 



J, =0.17 



J =0.30 



FlG. 3 Coefficients 
d'imprédictibilité, U, ob- 
tenus par simulation des 
expériences 1 (à gauche), 
et 2 (au centre). Cf. Fig. 2 
de [2] pour les expériences 
réelles. 



coefficients de Gini et d'imprédictibilité des mondes sous influence sociale, une fois que 
tous les autres paramètres du modèle ont été déterminés en tenant compte des mondes 
« indépendants ». 

D'après les valeurs de rrip, et de E, il vient que le point critique est obtenu analyti- 
quement pour J c ~ 0, 297. (Fait notable ? nous avions obtenu par calibrage J2 = 0, 30 pour 
l'expérience 2, i.e. J2 — J c , avant d'avoir déterminé la valeur de J c .) La table [l] récapitule 
les valeurs des coefficients de Gini, et d'imprédictibilité, obtenus dans les expériences 
réelles [2] et par simulations. 





G (exp.) 


U (exp.) 


J 


G (simul.) 


U (simul.) 


exp. 1 
exp. 2 


0,34 
0,48 


0,0081 
0,0125 


Ji = 0, 17 ~ J c /2 
J 2 = 0, 30 ~ J c 


0,33 
0,43 


0,0082 
0,0122 



TAB. 1 - coefficients de Gini, G, et d'imprédictibilité, U, obtenus dans les expériences réelles [2] 
(exp.) et par simulations (simul.), après calibrages des différents paramètres du modèle. 

Les figures [H reportent les valeurs des coefficients de Gini, G, des 8 mondes sous 
influence sociale et du monde « indépendant » , et ce pour les deux expériences. Ces figures 
peuvent se comparer à Fig. 1 de [2|. 

Les figures|3]reportent pour les expériences 1 et 2 les valeurs des coefficients d'imprédictibilité, 
U, des 8 mondes sous influence sociale et du monde « indépendant ». Ces figures peuvent 
se comparer à Fig. 2 de [2]. 

Les figures m montrent les succès relatifs m (ou 0) obtenus en présence d'influence 
sociale, en fonction du succès obtenu dans le monde « indépendant » (mais à une autre 
échelle que celle de Fig. 3 de |T|). Ces figures peuvent se comparer à Fig. 3 de [2]. 
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J„ = 0.30 



FlG. 4 — Succès relatif des chansons, cf>, obtenu en présence d'influence sociale, en fonction du 
succès relatif obtenu dans le monde « indépendant ». Cf. Fig. 3 de [2] pour les expériences réelles. 

La figure Hjreporte pour différentes valeurs de J et dans la limite continue (i.e. M, iV — > 
oo), la probabilité x a (voir Eq. ( I 31) ) pour la chanson a d'être choisie par un agent, en 
fonction de la « qualité » F a de la chanson a. 
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FlG. 5 — Probabilité pour la chanson a d'être 
choisie par un agent, x a = 4> a d (cf. Eq. (j 3 j) . 
où d désigne le nombre moyen de chansons 
téléchargées par agent), en fonction de la 
« qualité » F a de la chanson a (ici, de moyenne 
nulle et d'écart-type Hp = 0.2). Les courbes 
sont obtenues analytiquement dans la limite 
continue (i.e. M, N — ► oo). En trait hachuré : 
J = 0. En trait bleu : J = J± = 0.17. En trait 
noir continu : J = J c ~ 0.297 ~ J2. En trait 
rouge : J = 0.4. 



Les figures |6| montrent pour la modélisation de l'expérience 1 (i.e. avec J\ = 0,17), 
l'évolution des coefficient de Gini, G, et d'imprédictibilité, U, en fonction du nombre de 
participants. Elles peuvent se comparer aux figures S9(a) et S10(a) de [2]. 

Les figures tracent pour la modélisation de l'expérience 1 (i.e. J\ = 0, 17) les probabi- 
lités du nombre de chansons écoutées et téléchargées par participant, avec ou sans influence 
sociale. Les valeurs moyennes et médianes s'accordent avec les valeurs réelles données à la 
table S2 de [2]. A noter que la modélisation de l'expérience 2 (avec J 2 = 0, 30) ne permet 
pas de retrouver ces valeurs moyennes et médianes en présence d'influence sociale. Dans ce 
cas, le passage de J = à J = J 2 = 0, 30 implique une augmentation de 20% du nombre 
de chansons écoutées et téléchargées, en contradiction avec une diminution d'environ 10% 
dans les expériences réelles. 

Enfin, l'histogramme de la figure indique la probabilité de télécharger une chanson 
écoutée da ns la modélisation de l'expérience 1 (i.e. avec m! F = —0, 55 et S' F = 0, 2 de 



l'équation ( j 14 [) ). Elle peut se comparer indirectement à la figure S8 de [2], qui montre 
qualitativement un plus grand étalement de la distribution réelle comparée à celle obtenue 
par modélisation. Avec les données, maintenant accessibles [3], peut-être faudrait-il se 
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Jj =0.17 Jj = 0.17 




Agents Agents 

FlG. 6 - Évolution des coefficients de Gini, G (à gauche), et d'imprédictibilité, U (à droite), 
en fonction du nombre de participants, et pour l'expérience 1 (i.e. J\ = 0, 17). Cf. Fig. S9(a) et 
Fig. S10(a) de [2] pour les expériences réelles. 
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FlG. 7 - Probabilités du nombre de chansons écoutées (à gauche), et téléchargées (à droite) par 
participant, et pour la modélisation de l'expérience 1 (i.e. avec J\ = 0, 17). Les valeurs moyennes 
et médianes correspondent aux valeurs des expériences réelles (cf. Tab. S2) de [2]. 
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m' =-0.55 ; E - = 0.2 




,1 i I i I U I U I U I i I i I 

0,1 0,2 0,3 0,4 0,5 0.6 

Probabilité d' une chanson téléchargée par chanson écoutée 



FlG. 8 — Histogramme de la probabilité 
de télécharger une chanson écoutée dans la 
modélisation de l'expérience 1. Cf. Fig. S8 
de [2] pour les expériences réelles. 



focaliser uniquement sur la modélisation de la première étape (celle qui détermine les 
chansons écoutées), ou bien tenir compte d'une influence sociale qui se répercute aussi sur 
la seconde étape (en rapport avec le téléchargement des chansons écoutées). 
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